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Essentielle Gene unci Genprodukte zur Identifizierung, Entwicklung und 
Optimierung von immunologischen und pharmakologischen Wirkstoffen zur 
Behandlung mikrobieller Infektionen 

Beschreibung 

Die vorliegende Erfindung betrifft ein Verfahren zur Identifizierung und 
Charakterisierung essentieller Gene von pathogenen Mikroorganismen, deren 
Verwendung zum Auffinden neuer immunologischer und pharmakologischer 
Wirkstoffe zur Prophylaxe, Therapie und Diagnose bakterieller Infektionen, 
sowie die Weiterentwicklung und Optimierung dieser Wirkstoffe. Von der 
Erfindung eingeschlossen sind die entsprechenden Nukleinsauren, welche 
fur die essentiellen Genprodukte kodieren, und die davon kodierten 
Polypeptide. AuSerdem betrifft die Erfindung Vektoren, die die 
erfindungsgema&en Nukleinsauren enthalten, mit diesen Vektoren 
transformierte Zellen und fur die Polypeptide spezifische Antikorper. Diese 
Nukleinsauren und Polypeptide konnen zur Diagnose, Prevention und 
Behandlung von mikrobiellen Infektionen eingesetzt werden, insbesondere 
konnen sie zur Entwicklung von Antikorpern, Impfstoffen und Inhibitoren 
verwendet werden. 

Die vollstandige molekulare ErschlieSung des Genoms des Menschen und 
klinisch relevanter Pathogene offnet neue Wege in der Entwicklung von 
Therapeutika bzw. Prophylaktika gegen die Krankheiten des Menschen. So 
ist die Entschlusselung des menschlichen Genoms fur die nachsten Jahren 
angekundigt. Die Anzahl molekular vollstandig charakterisierter pathogener 
Keime nimmt standig zu. Das erklarte Ziel ist es nun, aus dem 
umfangreichen Datenmaterial solcheGenezu identifizieren, deren Produkte 
als potentielles Ziel fur einen Wirkstoff in Frage kommen und somit fur die 
Entwicklung eines spezifischen Wirkstoffs benutzt werden konnen. Dieses 



Potential lafct sich aus der Primarstruktur eines Gens nicht ableiten, sondern 
muB experimentell bestimmt werden. 

Liegt die komplette genomische Sequenz eines Organismus vor, steht man 
vor dem Problem, die enorme Datenmenge fur weiterfuhrende biologische 
Analysen zuganglich zu machen. Der erste Schritt ist die Identifizierung 
aller auf dem Genom liegenden Gene. Dies geschieht in der Regel mit Hilfe 
computergestutzter Suchprogramme, die mit einer gewissen Sicherheit 
potentielle Gene vorhersagen konnen. Auf diese Weise konnen Genkarten 
erstellt werden, die allerdings noch mit einer groSen Ungenauigkeit behaftet 
sind. Konnen die vom Suchprogramm ausgewiesenen Gene keinem 
bekannten Gen zugeordnet werden, mufc die Funktionalitat dieser 
hypothetischen Gene durch den physikalischen Nachweis der Genprodukte 
in der ursprunglichen Zelle nachgewiesen werden. 

Eine andere Strategie, die ebenfalls auf der Anwendung spezieller 
Suchprogramme beruht, ist auf die Identifizierung mdglicher Genfamilien 
ausgerichtet, die mit speziellen biologischen Eigenschaften verknupft sind, 
die wiederum aufgrund weiterer Annahmen als Wirkstoffziel in Betracht 
komrnen. Die Suchkriterien sind auf charakteristische Strukturmerkmale 
ausgerichtet, die in der Regel von schon bekannten Genen abgeleitet 
wurden. Das Ergebnis einer solchen Suche kann, in Abhangigkeit von der 
Annaherung der Vorgaben zum wirklichen Zustand, eine hohe Trefferquote 
liefern. In der Regel ist die Ungenauigkeit dieser Verfahren jedoch relativ 
hoch, und die wirkliche biologische Eigenschaft des Gens bzw. dessen 
Genprodukts muB auf jeden Fall experimentell bestatigt werden. 

Eine weitere Strategie erfafct die Expressionsprodukte einer Zelle, wodurch 
die zum jeweiligen Entwicklungszustand aktiven Gene identifiziert werden 
konnen. Vergleicht man verschiedene Entwicklungszustande miteinander, 
kann auf diese Weise das Zusammenwirken der Gene abgeleitet werden und 
in einigen Fallen kann die biologische Funktion unbekannter Gene teilweise 
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entschliisseltwerden. Fuhrtman entsprechende Vergleichsuntersuchungen 
mit Zellen durch, die ein pathologisches Erscheinungsbild haben, ist es 
sogar moglich auch krankheitsverursachende Gene zu identifizieren und 
diese als potentielle Wirkstoffziele fur die Wirkstoff entwicklung einzusetzen . 

Alle beschriebenen Verfahren dienen insbesondere dazu, bislang unbekannte 
Gene zu identifizieren und diesen mit Hilfe Computer-gestutzter 
Datenvergleiche eine biologische Funktion zuzuordnen. Eine eindeutige 
Bewertung eines Gens bzw. Genprodukts hinsichtlich seines Potentials als 
Wirkstoffziel zu dienen und somit fur die Entwicklung von Wirkstoffen 
herangezogen werden zu konnen, erfullt jedoch keines der bekannten 
Verfahren. 

Einige der wichtigsten Voraussetzungen fur einen pathogenen Organismus, 
in einem Wirt zu uberleben und sich zu vermehren, sind einerseits die 
Fahigkeit, dem Immunsystem des Wirts zu entgehen, und andererseits die 
Fahigkeit zur Anpassung an einen ganz speziellen Lebensraum oder Nische. 
Die dafiir verantwortlichen Faktoren und Proteine sind somit in der Regel 
essentiell fur den pathogenen Keim. 

Es ware von grofcem Vorteil, diese essentiellen Gene von Mikroorganismen 
zu identifizieren, urn auf diese Weise die Moglichkeit zur Hersteilung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln, z.B. 
Antikdrpern, Impfstoffen oder Inhibitoren der entsprechenden Polypeptide 
zu bekommen. 

Ein Pathogen von besonderem medizinischen Interesse ist Helicobacter 
pylori. Dieser Keim ist ein Gram-negatives, spiralformiges Bakterium mit 
hohem pathogenen Potential, das in den letzten Jahren verstarkt 
Resistenzen gegen eine Reihe therapeutisch relevanter Antibiotika 
entwickelt hat und somit von grower klinischer Bedeutung ist. Es zeichnet 
sich durch extrem hohe Beweglichkeit aufgrund seiner Flagellen und der 



ungewdhnlichen Fahigkeit, im stark sauren Milieu (bis pH 1,5) des Magens 
uberleben zu konnen, aus (Goodwin et al., 1989). 

Obgleich das Auftreten von spiralformigen Bakterien in der menschlichen 
Magenschleimhaut seit langem bekannt ist, wei& man erst seit der 
erfolgreichen Isolierung und Kultivierung dieses Bakteriums (Warren and 
Marshall 1983; Marshall et al., 1984) aus der Magenschleimhaut eines 
Patienten mit einem Magengeschwur (Ulcus ventriculi), da& es sich hierbei 
um pathogene Keime handelt. Die Mpy/o/v-lnfektion zahlt zu den haufigsten 
chronischen bakteriellen Infektionen des Menschen. Sie tritt weltweit auf, 
wobei ca. 50% der Bevolkerung mit diesem Bakterium infiziert sind. 

Eine Infektion fuhrt zwangslaufig zur Ausldsung einer bakteriellen Gastritis 
(Typ-B Gastritis) beim Menschen. Ferner geht man davon aus, daS H. pylori 
auch eine ursachliche Rolle bei der Entstehung von Magen- und 
Zwdlffingerdarmgeschwuren (Ulcus ventriculi und Ulcus duodeni) sowie bei 
einigen Formen des Magenkarzinoms (Adenokarzinom) spielt (Lee et aL, 
1 993; Solnick und Tompkins, 1 993). In zwei Studien von 1 991 wurde eine 
statistisch signifikante Korrelation zwischen der H. pyfori-\nf ekt\on und dem 
Auftreten des Magenkarzinoms (intestinaler Typ) gezeigt, wobei beide 
Studien zu dem SchluS kamen, daS ca. 60% aller auftretenden 
Magenkarzinome wahrscheinlich auf eine Mpy/o/y-lnfektion zuruckzufuhren 
sind (Parsonnet et al., 1991; Nomura et al., 1991). Auch die seltener 
auftretenden MALT (Mucosa Associated Lymphoid Tissue) Lymphome des 
Magens, die als Vorstufen von B-Zell-Tumoren des Immunsystems 
angesehen werden, sind vermutlich eine Folge der //.py/o/v-lnfektion. Eine 
Folge der Langzeitinfektion mit H. pylori ist die atrophische Gastritis, eine 
Degeneration der Schleim, Saure oder Pepsin produzierenden Zellen des 
Magenepithels, die als eine prakanzerose Lasion angesehen werden muB. 

Nach der oralen Aufnahme gelangen die Bakterien zunachst in das extrem 
saure Magenlumen (pH 1 bis 2). Dort wird durch die Produktion des Enzyms 



Urease, das zur Spaltung des vorhandenen Harnstoffs und damit zur lokalen 
Neutralisierung des sauren pH-Wertes im Magen fuhrt, was das Uberleben 
der Bakterien ermoglicht. Mittels chemotaktischer Orientierung und 
flagellenabhangiger Motilitat bewegen sich die Keime dann in die 
Bicarbonat-gepufferteSchleimschichtder Antrum-Region des Magens, ihren 
eigentlichen naturlichen Habitat. Dort befinden sie sich in einer einzigartigen 
okologischen Nische, die aufgrund der Saurebarriere nur fur wenige 
konkurrierende Bakterienarten zuganglich ist. Vermutlich orientieren sich die 
Bakterien an den pH-Gradienten zwischen Lumen (pH 1-2) und 
Epithelzelloberflache (pH 6-7), urn zum Epithel zu gelangen. Durch ihre 
spiralige Form, ihre Beweglichkeit im viskosen Schleim, die Produktion von 
Mukus-modifizierenden Enzymen und schliefclich durch eine mikroaerophile 
Lebensweise sind diese Keime optimal an die Lebensbedingungen in diesem 
Habitat angepaSt. Sie halten sich meist in den tiefen Krypten der Antrum- 
Region auf, wo sie vor aufceren Einflussen wie z.B. Saure, Pepsin aber auch 
vor Medikamenten zu ihrer Eradikation, wie z.B. Antibiotika, geschutzt sind. 
Ein Teil der Bakterienpopulation (ca. 20%) ist eng mit Epithelzellen 
assoziiert, vor allem mit Schleim produzierenden Zellen. Unter der 
Voraussetzung einer gastralen Metaplasie, d.h. der saureinduzierten 
Ausbildung von gastralem Epithel im Duodenum, kommt es auch zur 
Kolonisierung metaplastischer Areale im Zwolffingerdarm, wodurch die 
Voraussetzungen zur Entstehung des Zwdlffingerdarmgeschwurs (Ulcus 
duodeni) geschaff en sind . Durch ihre Fahigkeit zur Adharenz wird vermutlich 
eine komplette Ausscheidung der Helicobacter mit dem abgestoSenen 
Schleim verhindert, so daB die Bakterien fur Jahre, Jahrzehnte oder gar 
lebensiang persistieren konnen (chronische Infektion). 

Bevor die Existenz und die Bedeutung des H. pylori fur die 
Ulkuserkrankungen bekannt waren, wurden diese durch sog. Antazida, oder 
H 2 -Rezeptorantagonisten behandelt. Dabei handelt es sich urn Substanzen, 
welche die Sauresekretion der Magenparietalzelle inhibieren. Unter dem 
EinfluB dieser Arzneimittel kommt es zwar zumeist zur Abheilung von 



GeschwQren, da jedoch eine der Ursachen dieser Geschwiire, namlich die 
A/.py/o/7-lnfektion, damit nicht eliminiert wird, kommt es in den meisten 
Fallen nach kurzer Zeitzu einem erneuten Auftreten der Ulzeration (Rezidiv). 

Eine weitere, haufig bei Ulzerationen angewandte Therapie ist die Wismut- 
Behandlung. Verschiedene Wismut-Salze (CBS, BSS) haben einen 
bakteriziden Effekt auf H. pylori. Ein bedeutender Nachteil dieser 
Therapieform ist jedoch, daB eine totale Eradikation des Keims nur in einem 
sehr geringen Prozentsatz der Falle erreicht wird (8 bis 32%). Wie bei der 
Behandlung mit Antazida kommt es nur zu einer voriibergehenden 
Suppression des Keims, und nach Absetzen der Behandlung erfolgt in den 
meisten Fallen wieder ein Aufflackern der Infektion. Ein weiterer Nachteil 
der Wismut-Behandlung ist, dafceine langer dauerende Therapie mit hohen 
Dosen zu einer Akkumulation dieser Substanz in der Leber, Niere und dem 
Nervensystem fuhrt und betrachtliche neurologische Nebenwirkungen hat 
(Malfertheiner, 1994). 

Seit der Erkenntnis, daS es sich bei den gastroduodenalen 
Ulkuserkrankungen urn Infektionskrankheiten handelt, werden zur 
Behandlung nun auch Antibiotika eingesetzt. Die Monotherapie mit 
verschiedenen Antibiotika (Amoxicillin, Nitrofuran, Furazolidin, Erythromycin 
und dergleichen) stellte sich jedoch als nicht zufriedenstellend heraus, da es 
auch hier nur bei 0 bis 15 % der Zellen zur kompletten Eradikation der 
Keime kommt. Die bisher erfolgreichste Behandlung wird zur Zeit durch eine 
Kombination eines Saureblockers (Ompeprazol) mit einem Antibiotikum 
(Amoxicillin) erreicht, die zu Eradikationsraten bis zu 80% fuhren kann 
(Malfertheiner, 1994). Auf die Dauer ist eine Antibiotikabehandiung zur 
Eliminierung von H.pylori jedoch nicht erfolgversprechend, da aufgrund der 
unvollstandigen Eradikation des Keims mit einer raschen Resistenz- 
entwicklung der Bakterien gegen Antibiotika gerechnet werden muS. 



Das zunehmende Auftreten von Antibiotika-Resistenzen und die 
eingeschrankten Behandlungsoptionen, die in der Regel betrachtliche 
unerwunschte Nebenwirkungen haben, macht das Auffinden neuer 
Therapieformen und dabei insbesondere die Identif izierung neuer Wirkstoffe 
notwendig, vor allem Impfstoffe, die sowohl zur prophylaktischen, als auch 
therapeutischen Behandlung von ^e//co£acter-lnfektionen verwendet 
werden konnen. Von besonderem Interesse ist auch die Darreichungsform, 
da der Wirkstoff im Magen, d. h. in einem extrem sauren Milieu wirksam 
sein muS. Verbindungen mit Protonenblockern, die z. B. vor der 
Verabreichung des prophylaktischen oder therapeutischen Wirkstoffs 
gegeben werden, konnen hierbei von groBem Nutzen sein. 

Die molekulare Grundlage fur persistierende, chronische Helicobacter- 
Infektionen ist bislang noch nicht geklart. Es konnte gezeigt werden, date 
die Faktoren Urease, Beweglichkeit und Adharenz essentielle Eigenschaften 
des Bakteriums sind, die gastrische Mukosa kolonisieren zu konnen. 
Obgleich der Wirtsorganismus unter normalen Bedingungen nicht in der Lage 
ist, mit einer Mpy/or/'-lnfektion fertig zu werden, zeigte sich im Tiermodell, 
date die Urease, ein essentieller Virulenzfaktor von H. pylori, ein hohes 
Potential als Vakzin besitzt (US-Patentanmeldung US-SN-07/970,006 
"Urease-based Vaccine Against Helicobacter Infection). 

Diejenigen Komponenten jedoch, die dafur verantwortlich sind, date das 
Pathogen das Immunsystem des Wirtes umgehen kann, sind bisher noch 
unbekannt. 

Pathogene Organismen im Allgemeinen haben eine Vielzahl von Strategien 
entwickelt, im Wirt uber einen langen Zeitraum vom Immunsystem 
unbehelligt persistieren zu konnen (Haas und Gobel, 1992; Finlay und 
Falkow, 1 997). Ein Mechanismus, der zum Uberleben in lebensfeindlichem 
Milieu dient, ist die Ausbildung einer Uberdauerungsform. 



Im Falle von H. pylori sind in der Literatur kokkoide Formen als potentielle 
Oberdauerungsformen mehrfach beschrieben, ihre klinische Bedeutuhg ist 
allerdings umstritten. Kokkoide Formen konnten fur eine ex vivo 
Uberdauerung eine groSe Rolle spielen. Hinsichtlich der in vivo 
Oberdauerung wurde gezeigt, daft kokkoide Formen bevorzugt durch ein 
ungunstiges Milieu wie z. B. einen hohen 0 2 -Partialdruck oder subletale 
Gaben von Antibiotika (Wismut-Subcitrat, Erythromycin, Amoxicillin, 
Metronidazol) induziert werden (Donelli et al., 1 998; Bode et al., 1 993; 
Sorberg eta/., 1996; Berry eta/., 1995). 

Einige Forscher gehen davon aus, daS diese kokkoiden Bakterien 
lebensfahig, aber nicht kultivierbar sind (VNC, viable but non-culturable). 
Eaton und Mitarbeiter erhielten eine erfolgreiche Infektion von Mini- 
Schweinchen mit vegetativen (spiraligen) H. pylori, wahrend kokkoide 
Formen in diesem Modell keine Infektion zeigten (Eaton eta/., 1995). Der 
direkte Nach weis von kokkoiden Formen im menschlichen Magen wurde von 
Chan et al. anhand von Magengewebeschnitten aus Biopsiematerial 
erbracht. In 82.8 % (53/64)der untersuchten Biopsieproben konnten die 
Autoren kokkoide Formen von H. pylori nachweisen (Chan et al, 1994). 
Von Cao et al. wurde ein monoklonaler Antikorper zum spezifischen 
Nachweis von kokkoiden H. pylori im Gewebeschnitt benutzt. Auch hier 
wurden neben den vegetativen Formen in 100 % der Antrumbiopsien (9/9) 
H. pylori kokkoide Formen nachgewiesen (Cao et al., 1997). 

Die Bindung an Epithelzellen und die Fahigkeit zur Signaltransduktion (IL-8- 
Induktion, Rearrangement des Zytoskeletts, Bindung von Plasminogen, 
Laktoferrin und Vitronectin auf der Bakterienoberflache) scheint bei 
kokkoiden Formen vergleichbar zu den vegetativen Formen erhalten zu sein 
(Khin eta/., 1996; Segal eta/., 1996). 

Die oben genannten Experimente deuten auf eine Bedeutung kokkoider 
Formen fur die Oberlebensfahigkeit von Helicobacter in ungunstigem Milieu 



hin. Daher ist die Identifizierung von Genen, die mit der Entstehung dieser 
Form und Reaktivierung in die vitale Form zusammenhangen, fur die 
Entwicklung neuer Wirkstoffe von grofctem Interesse. 

Neben Helicobacter pylori konnen auch andere Helicobacter Spezies den 
Magen des Menschen kolonisieren wie z. B. H. heilmannii und H. felis. 
Diesbezuglich konnte gezeigt werden, dafc auch H. heilmannii mit 
krankhaften Ulkuserkrankungen in Zusammenhang gebracht werden kann. 
Die ursachliche Ubertragung findet wahrscheinlich von Haustieren auf den 
Menschen statt. Bislang wurde der im Menschen haufig vorkommende 
H. pylori \n den Verdacht gebracht, bei der Entstehung von Magenkrebs eine 
Rolle zu spielen. Mittlerweile gibt es klinische Daten, die diesen 
Zusammenhang anzweifeln. Besonders werden diese Zweifel durch neuere 
Daten von Helicobacter heilmannii unterstutzt, die diesem ein groBeres 
kanzerogenes Potential beimessen und dessen Bedeutung bei der 
Entstehung des gastrischen MALT Lymphoms hervorherben (Regimbeau et 
a/., 1988). 

Wird das bisher Gesagte zusammenfassend betrachtet, ist es klar, daS ein 
Bedurfnis nach neuen Therapieformen fur die Bekampfung bakterieller 
Krankheitserreger, insbesondere nach Impfstoffen und Inhibitoren von 
essentiellen Genen bzw. deren Expressionsprodukten besteht. Die 
zunehmende Resistenzentwickung gegen eine Vielzahl bewahrter 
Medikamente erfordert eine kontinuierliche Versorgung mit neuen 
Wirkstoffen. Dieser steigende Bedarf an neuen Wirkstoffen kann nur 
gedeckt werden, wenn neue Wirkstoffzieie identifiziert und diese zur 
Entwicklung neuer Wirkstoffe herangezogen werden. Essentielle Gene 
stellen fur die Wirkstoffentwicklung ein ideales Ziel dar, da sie fur das 
Uberleben des Krankheitserregers notwendig sind. 

Die Identifizierung essentieller Gene von Helicobacter, insbesondere von 
H. pylori bzw. heilmannii und von moglichen Helicobacter 
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Uberdauerungsformen zur Entwicklung und Optimierung neuer 
therapeutischer, praventiver und/oder diagnostischer Mittel, wie z. B. 
Impfstoffe und pharmakologischer Wirkstoffe stellt daher ein Ziel der 
Erfindung dar. Im Vordergrund stent das Auffinden essentieller mikrobieller 
Gene, wobei auch homologe Proteine verschiedener pathogener Keime 
identifiziert werden konnen. Mit Hilfe eines Wirkstoffs konnten dann wie bei 
den klassischen Antibiotika mehrere pathogene Keime gleichzeitig eliminiert 
werden. Bei Helicobacter stehen insbesondere Gene im Vordergrund, die 
lebensnotwendige Funktionen im Infektionsprozefcerfiillen, sowie Gene, die 
an der Entwicklung und Reaktivierung von kokkoiden Formen beteiligt sind. 
Von besonderem Interesse sind hierbei essentielle Gene, die fur sekretierte 
Genprodukte kodieren, da diese fur immunologische und pharmakologische 
Wirkstoffe aufgrund ihrer exponierten Lokalisation besonders gut erreicht 
werden konnen und daher gute Kandidaten zur Wirkstoffentwicklung sind. 
Weiterhin von Interesse sind essentielle Gene, die fur Genprodukte kodieren, 
die an der Entwicklung und der Aufrechterhaltung von 
Uberdauerungsformen beteiligt sind. Eine weitere Aufgabe ist das Auffinden 
essentieller mikrobieller Gene, wobei auch homologe Proteine verschiedener 
pathogener Keime identifiziert werden konnen. Mit Hilfe eines Wirkstoffs 
konnten dann wie bei den klassischen Antibiotika mehrere pathogene Keime 
gleichzeitig eliminiert werden. 

Diese Aufgabe wird gelost durch ein Verfahren zur Bereitstellung von 
Mitteln zum Nachweis, zur Therapie oder/und zur Prevention von 
mikrobiellen Infektionen, das die folgenden Schritte umfafct: 
(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendefizienter Mikroorganismen durch 
konditionale Antisense-Hemmung (CAI) oder/und subtraktive 
Rekombinations-Mutagenese (SRM) und Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen in einem 
Testsystem. 



- 11 - 

(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung der 
Mikroorganismen oder verwendeter Mikroorganismen herbeifuhren. 

(C) Tester* der identifizierten Wirkstoffe auf ihre Anwendbarkeit als 
Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Das hier dargestellte Verfahren befafct sich mit der Identifizierung 
essentieller Gene und deren Verwendung zur Entwicklung neuer Wirkstoffe. 

Ein weiterer Aspekt der vorliegenden Erfindung ist somit auch ein Verfahren 
zum Identifizieren von essentiellen mikrobiellen Genen, das die folgenden 
Schritte umfaBt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Oberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer mikrobiellen 
DNA-Sequenz, in der die gendefizienten Mikroorganismen defiziert 
sind und 

(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur die 
Oberlebensfahigkeit sind. 

CAI ist die Abkurzung fur ^conditional antisense inhibition", d.h. 
konditionale Antisensehemmung. Es handelt sich hierbei urn ein Verfahren, 
welches wetter unten naher beschrieben ist. 

SRM steht fur „subtractive recombination mutagenesis", d.h. subtraktive 
Rekombinationsmutagenese und ist ebenfalls unten beschrieben. 
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Der Ausdruck "gendefizient", wie er hier verwendet wird, bedeutet, daS der 
defiziente Organismus nicht in der Lage ist, ein oder mehrere seiner 
Genprodukte herzustellen oder deren Funktion zu nutzen. Die Herstellung 
des entsprechenden Genprodukts kann einerseits durch Mutagenese des 
entsprechenden Gens verhindert werden, oder es kann eine Inhibition 
wahrend der Expression stattfinden, z.B. durch Antisensenukleinsauren. 
Eine Mutagenese kann dazu eingesetzt werden, ein Gen in dem Genom des 
Mikroorganismus zu mutieren, oder dazu, ein mutiertes Gen in den 
Mikroorganismus einzubrigen, wobei man sich auch die homologe 
Rekombination zunutze machen kann. 

Ein proteinkodierender Abschnitt einer Nukleinsauresequenz ist beispielweise 
ein Gen oder ein Teil eines Gens das/der die Expression eines Polypeptids 
erlaubt. 

Der Begriff "essentielles Gen" bedeutet ein Gen, das fur ein Genprodukt 
kodiert, ohne welches ein Organismus nicht uberlebensfahig ist oder nur 
beschrankt uberlebensfahig ist. Essentielle Gene konnen in zwei Klassen 
unterteilt werden: obligat essentielle und fakultativ essentielle Gene. Ein 
obligat essentielles Gen kodiert fur ein Protein, das fur das Uberleben oder 
die Vermehrung eines Organismus unter alien Umstanden unabdingbar ist. 
Demgegenuber kodiert ein fakultativ essentielles Gen fur ein Protein, das 
lediglich unter bestimmten Bedingungen fur das Uberleben oder die 
Vermehrung des Organismus notwendig ist, wie z.B. die Fahigkeit des 
Organismus, innerhalb von kultivierten Saugerzellen oder im Tier zu 
uberleben. In beiden Fallen wird das Uberleben oder die Vermehrung des 
Organismus durch die Inaktivierung eines fur ihn essentiellen Gens bzw. die 
Inhibierung eines fur ihn essentiellen Genproduktes stark beeintrachtigt bzw. 
verhindert. Ist ein Bakterium nach der Inaktivierung eines bestimmten Gens 
nicht mehr uberlebensfahig bzw. in der Vermehrung eingeschrankt, kann 
dies als erster Hinweis dafiir gewertet werden, da& durch dieses Gen 
essentielle Eigenschaften vermittelt werden. Die Aussagekraft solcher 
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Befunde muB jedoch durch begleitende Kontrollexperimente untermauert 
werden, z.B. sollte eine solche letale Mutation in einem zweiten Schritt 
durch eine entsprechende Komplementation des Gens bzw. Genprodukts 
aufgehoben werden konnen. Obligat essentielle Gene sind demnach solche, 
deren Nichtexpression oder Nichtvorhandensein, z.B. durch Mutagenese 
Oder Deletion dazu fuhrt, date der Organismus weder in natiirlicher 
Umgebung, noch auf einem ideal auf die Bedurfnisse des Mikroorganismus 
abgestimmten Vollmedium lebensfahig ist. 1st ein Mikroorganismus in einem 
fakultativ essentiellen Gen defizient, ist er in der Regel auf einem solchen 
je nach Organismus definierten Vollmedium noch wachstumsfahig, kann 
jedoch in natiirlicher Umgebung, d.h. in seinem naturlichen Wirt oder Zellen 
oder Gewebekulturen seines naturlichen Wirtes nicht mehr uberleben. 

Identifizieren von essentiellen Genen 

Durch das neue Verfahren konnen unabhangig von ihrer speziellen Funktion 
essentielle Gene von Mikroorganismen identifiziert werden. Bevorzugt wird 
dieses Verfahren zur Identifizierung von essentiellen Genen aus Helicobacter 
und verwandten Mikroorganismen eingesetzt. 

In einem ersten Teilschritt wird das komplette Genom eines bakteriellen 
Krankheitserregers mit einem molekulargenetischen Ansatz nach essentiellen 
Genen durchsucht. Dieser Teilschritt erfordert keinerlei Kenntnisse uber die 
Primarstruktur des Genoms bzw. individueller Gene, sondern erfolgt 
ausschlieSlich aufgrund biologischer Kriterien. Ist ein Gen als essentielle 
Determinante identifiziert, wird dessen identitat ermittelt. Hierbei kann auf 
die ermittelten Rohsequenzdaten der genomischen Sequenzierungen 
zuriickgegriffen werden. Anhand der ermittelten Gensequenz konnen z. B. 
isogene Varianten ermittelt werden bzw. ob sich das ermittelte Gen in einem 
Operon befindet, in dem sich moglicherweise weitere essentielle Gene 
befinden. 
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In einem zweiten Teilschritt werden die identifizierten Gene in spezielle 
genetische Systeme uberfuhrt, die dazu dienen die Gene bzw. deren 
Genprodukte einem direkten Wirkstoff-Screening zuzufuhren und/oder die 
Gene bzw. Genprodukte dazu verwendet, bereits identifizierte Wirkstoffe 
weiter zu optimieren. Der wesentliche Vorteil des Gesamtverfahrens beruht 
auf der rasch aufeinanderfolgenden Ausfuhrung des Gen- und Wirkstoff- 
Screenings in aussagekraftigen biologischen Systemen, so daS in relativ 
kurzer Zeit aus dem kompletten Gensatz eines pathogenen Mikroorganismus 
die potentiellen Wirkstoffziele identifiziert, produziert und diese direkt zum 
Wirkstoff-Screening bzw. Optimierung eingesetzt werden konnen. 

Falls ein Mirkoorganismus untersucht wird, dessen Genom bereits 
sequenziert ist, kann die Identifizierung eines Gens oder Genabschnitts mit 
Hilfe von Datenbankanalysen erfolgen, wobei einem Sequenzabschnitt ein 
Leserahmen zugeordnet wird. Bevorzugt kann jedoch unabhangig vom 
Vorhandensein einer vollstandigen Genomerzeugung eine beliebige Genbank 
einer Vorselektion unterzogen werden. Dabei kann bevorzugt die 
Vorselektion auf Gene durchgefuhrt werden, die fur Polypeptide mit einer 
bestimmten Funktion kodieren, zum Beispiel mit Hilfe von 
Homologieanalysen. Die Vorselektion kann auch auf Gene durchgefuhrt 
werden, die nur in bestimmten Entwicklungsstufen exprimiert werden. 

Im Rahmen des ersten Teilschritts kann durch Selektionsschritte eine starke 
Reduktion des zu untersuchenden Genmaterials erzielt werden. Z.B. durch 
einen Anreicherungsschritt fur Gene, die fur exportierte oder sekretierte 
Genprodukte kodieren. In diesem speziellen Verfahren werden die DNA- 
Abschnitte einer Genbank von einem Pathogen mutagenisiert, was 
beispielsweise durch Klonieren eines solchen DNA-Abschnitts in ein 
Plasmid, Transformation in einen bevorzugt heterologen Wirtsorganismus 
und anschliefcende Mutagenese erfolgen kann. Das daraus entstandene 
Expressionsprodukt kann dann nachgewiesen werden. Die Mutagenese kann 
beispielsweise durch Insertion einer Markersequenz erfolgen, welche bei 
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Expression der mutagenisierten Sequenz in einem Wirtsorganismus zu einem 
Fusionspolypeptid fiihrt, auf das selektiert werden kann. Die Insertion der 
Markersequenz ist nicht auf Transposoninsertion beschrankt, sondern kann 
auch auf andere Art und Weise erfolgen, beispielsweise durch homologe 
Rekombination oder Infektion und Rekombination mit Hilfe von 
Bakteriophagen. 

Die verwendete Markersequenz im Sinne der vorliegenden Erfindung ist im 
allgemeinen ein Gen, das fur ein Genprodukt kodiert, das eine Selektion auf 
diejenigen Wirtsorganismen erlaubt, welche diese Sequenz exprimieren. Im 
allgemeinen handelt es sich bei diesen Markersequenzen urn Resistenzgene, 
die Resistenz gegen bestimmte Antibiotika verleihen, oder welche es dem 
Wirtsorganismus erlauben, in einem Selektionsmedium zu uberleben. Der 
Genmarker besitzt bevorzugt keine eigenen Expressionssignale, sondern ist 
direkt abhangig von einem vorgeschalteten Promoter, wie z.B. dem 
Transkriptionspromotor auf dem Promotersegment oder ein Promoter, der 
auf dem klonierten heterologen zu identifizierenden DNA-Fragment liegt. 
Alternativ zu Antibiotikaresistenz-Markersequenzen konnen auch Enzyme als 
Genmarker eingesetzt werden. In diesen Fallen wird die erfolgreiche 
Insertion durch eine bestimmte Farbreaktion angezeigt, welche die manuelle 
Isolierung des entsprechenden Bakterienklons erlaubt. 

Wenn die Markersequenz als Fusionsprotein mit dem Expressionsprodukt 
des inserierten DNA-Fragments exprimiert wird und eine Selektion wie oben 
beschrieben durchgefiihrt wird, kann DNA-Material aus den selektierten 
Bakterienklonen isoliert werden und die DNA-Sequenz, die fur das 
Fusionsprodukt kodiert, nach bekannten Verfahren bestimmt werden. Dies 
erlaubt die Zuweisung eines Leserahmens zu dem zu identifizierenden DNA- 
Fragment. Es istdann moglich, Vergleichsstudien mitallgemein verfugbaren 
DNA-Sequenzdatenbanken durchzufuhren, um die Identitat des 
identifizierten Gens abzuklaren und gegebenenfalls Hinweise auf eine 
biologische Funktion zu erlangen. 



- 16 - 

Durch technische und weitere Erganzungen der beiden unten dargestellten 
Verfahren, CAI und SRM, kann eine zielgerichtete Reduktion des 
Probenvolumens erreicht werden. Dabei handelt es sich ebenfalls um 
vorgeschaltete Selektionsverfahren, die auf bestimmte Gengruppen abzielen, 
z.B. der Einsatz subtraktiver Genbanken von pathogenen und apathogener 
Vertretern. Hierbei werden pathogenitatsvermittelnde Genbereiche 
angereichert. Derartige Subtraktionsverfahren konnen auch angewendet 
werden, um fur bestimmte Organismen spezifische Gene zu identifizieren, 
beispielsweise durch einen Vergleich und Subtraktion der Genomen von 
H. pylori und H.heilmannii. 



In weiteren Verfahren konnen z.B. Gengruppen identifiziert werden, die nur 
in einem bestimmten Entwicklungsschritt exprimiert werden. 
Hervorzuheben ist beispielsweise das Array-Verfahren, bei dem die 
einzelnen Genproben des Pathogens rasterfdrmig auf einen Trager 
aufgebracht werden. Die einzelnen Auftragspunkte sind bekannt, so daS 
bei einer positiven Hybridisierungsreaktion mit den entwicklungsspezifischen 
Transkriptionsprodukten oder cDNAs oder subtraktiven cDNAs oder 
Fragmente davon, die jeweiligen Gene identifiziert und anschlie&end kloniert 
werden konnen. Andere Verfahren, die entwicklungsspezifische Gengruppen 
erfassen, sind vergleichende Proteom- und Differential-Display-Analysen. 

Um herauszufinden, ob es sich bei den identifizierten Gensequenzen um 
essentielle Gene handelt, werden Mikroorganismen hergestellt, welche in 
den Sequenzen defizient sind, welche den identifizierten Gensequenzen 
entsprechen. Die defizienten Mikroorganismen werden dann auf 
verschiedenen Wachstumsmedien bzw. Zellkulturen oder im Tiermodell oder 
im natiirlichen Wirt getestet, und die defizienten Gene konnen dann je nach 
Wachstumsfahigkeit einer Kategorie der nicht essentiellen, obligat 
essentiellen oder fakultativ essentiellen Gene zugeordnet werden. 
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Auf die Bedeutung von Genen, welche die Entwicklung aus der vitalen in die 
Uberdauerungsform und umgekehrt steuern, ist bereits eingangs 
hingewiesen worden. Es ist daher besonders bevorzugt, eine Vorselektion 
auf solche Gene durchzufuhren. Im Weiteren konnen Verfahren wie etwa 
CAI oder SRM angewendet werden und die gendef izienten Mikroorganismen 
dann auf bestimmten Nahrmedien untersucht werden, Welche den Ubergang 
von der einen in die andere Form auslosen. Bei Helicobacter \st insbesondere 
das Schivo-Medium bevorzugt, welches die Reaktivierung der kokkoiden 
Form in die vitale spiralige Form ermoglicht. 

Die Erzeugung von defizienten Mikroorganismen kann auf mehrere Arten 
erfolgen. 

Es stehen eine Reihe von molekulargenetischen Verfahren zur Verfugung, 
das Genom eines bakteriellen Pathogens so zu mutagenisieren, daS von 
jedem Gen eine Mutante zur Verfugung steht. Die gangigste 
Mutagenesemethode beruht auf der Inaktivierung von Genen, z. B. durch 
zuf allig im Genom inserierende Transposons, die uber entsprechende Marker 
selektioniert werden. Fur dieses Verfahren bestehen zahlreiche Variationen, 
die auf verschiedene Organismen angewendet werden konnen. (Joyce und 
Grindley, 1984; Akerley, et aL, 1998). Mit Hilfe der inserierten 
Transposons la&t sich auch das mutagenisierte Gen im Genom genau 
lokalisieren. 

Hat man eine Genmutante mit einem nachweisbaren biologischen Effekt 
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Milieu, so muB in einem zweiten Schritt die eindeutige Kopplung des Gens 
bzw. des Genprodukts mit dieser Eigenschaft nachgewiesen werden. Dies 
geschieht in der Regel durch Komplementationsexperimente. In diesem Fall 
wird in den Organismus mit der spezifischen Genmutante das ursprungliche 
Gen eingebracht und exprimiert. Kann uber diesen Weg die ursprungliche 
Eigenschaft des Organismus regeneriert werden, ist der notwendige Beweis 
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erbracht. Allerdings laSt sich dieses Verfahren nicht bei der 
Charakterisierung von Letalmutanten anwenden, d.h. bei Mutanten obligat 
essentieller Gene. Einen Ausweg bietet die Verwendung konditionaler 
Mutationen zur Komplementation. Z. B. lassen sich durch chemische 
Mutagenese des untersuchten Gens temperatursensitive Mutanten 
erzeugen, die das Genprodukt bei der normalerweise optimalen 
Wachstumstemperatur in eine inaktive Zustandsform bringen und bei 
niedrigeren Temperaturen ein biologisch aktives Genprodukt hervorbringen 
(Das, et al., 1976; Harris, et al., 1992; Hou, et al, 1994; Polissi and 
Georgopoulos, 1996). In einem anderen praktizierten Ansatz werden die 
wildtypischen Komplementationen durch exogene Substanzen, sogen. 
Induktoren, gesteuert. Uber diese Induktoren wird die Expression des 
komplementierenden Gens eingeschaltet, das auf einem Episom in die 
genspezifische Mutante eingebracht wird und nach Induktion das fehlende 
Genprodukt ersetzt (Murphy, etal., 1995-. Chow and Berg, 1 988; Arigoni, 
eta/., 1998). 

Die genannten Verfahren sind sehr zeitaufwendig und werden nur fur die 
Untersuchung individueller Gene oder begrenzter genomischer Abschnitte 
eingesetzt. Verfahren, die eine durchgangige Charakterisierung einer 
vollstandigen, mutagenisierten Genbank eines ausgewahlten Pathogens 
nach dem beschriebenen Schema ermdglichen, sind bislang nicht bekannt. 

Die nachfolgend beschriebenen neuen genetischen Verfahren, die 
Konditionale Antisense-Hemmung (CAI) und die Subtraktive 
Rekombinationsmutagenese (SRM) erfullen diese Anforderungen. Beide 
Verfahren konnen zur Identifizierung essentieller Gene eingesetzt werden, 
wobei sich das CAI-Verfahren besonders fur die Identifizierung obligat 
essentieller Gene eignet und das SRM-Verfahreh fur fakultativ essentielle 
Gene. 
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Das CAI-Verfahren beruht auf der konditionalen Hemmung der Translation 
von einem oder mehreren Genen, die auf einem klonierten Genomfragment 
(welches dann als Matrize oder Template dient) liegen und uber ein Plasmid 
im zu untersuchenden Keim propagiert werden. Im Vergleich zu 
konventionellen Verfahren bleibt die genomische Struktur des zu 
untersuchenden Keims unverandert, d.h. im Originalzustand. Im zu 
untersuchenden Keim wird die Hemmung der Translation durch die 
konditional induzierbare Synthese spezifischer Antisense-RNA (asRNA) 
ausgelost, die das komplette klonierte Genomfragment umfafct, inklusive der 
auf dem Genomfragment lokalisierten Gene. Die Antisense- 
Nukleinsauresequenzen konnen dann im Mikroorganismus in groBen Mengen 
synthetisiert werden und binden an die ursprungliche mRNA, wobei diese 
mRNA nicht mehr translatiert werden kann und somit dem 
Expressionsapparat entzogen wird. Die Folge ist, daS entweder kein 
Genprodukt oder nur geringe Mengen davon gebildet werden. Die Synthese 
der asRNA unterliegt der Kontrolle durch einen Promoter (asPromoter), 
dessen Aktivitat konditional, durch definierte, externe Signale gesteuert 
wird. Diese konditionale Inhibition der Expression eines Gens oder Operons 
erfolgt somit uber die Regulation der Synthese der asRNA durch den 
induzierbaren asPromoter. Zum Nachweis, dafc ein Gen bzw. Operon, wie 
im vorliegenden Fall, fur das Uberleben und die Vermehrung des Organismus 
unter bestimmten Bedingungen essentiell ist, wird die Uberlebens- und 
Vermehrungsrate eines Klons, in dem die Synthese der asRNA induziert ist, 
mit seiner Uberlebens-/Vermehrungsrate bei nicht induzierter asRNA 
Synthese verglichen. Ist die Uberlebens-/Vermehrungsrate des Klons bei 
Induktion der asRNA Synthese vermindert, so handelt es sich bei dem 
inhibierten Gen bzw. Operon urn ein (obligat oder fakultativ) essentielles 
Gen. Diese Wachstumsanalysen konnen automatisiertdurchgefuhrt werden, 
so daB eine sehr grofce Anzahl von Genen innerhalb kurzer Zeit untersucht 
werden konnen. Aus diesen Klonen wird das Plasmid isoliert und die DNA- 
Sequenz des klonierten Genomfragments, das als Template fur die asRNA 



- 20 - 

Synthese dient, bestimmt und in Folge die Struktur des essentiellen Gens 
ermittelt. 

Ein fur das CAI-Verfahren geeigneter Plasmidvektor ist in Abbildung 1 
dargestellt. Erenthalteingenomischesodersubgenomisches DNA-Fragment 
aus dem zu untersuchenden Mikroorganismus unter der Kontrolle eines 
induzierbaren Promoters (P) und weiteren ublichen Expressionssignalen 
sowie ein mRNA-stabilisierendes Element, so daS das DNA-Fragment in 
Form von Antisense RNA (asRNA) exprimiert werden kann und eine lange 
biologische Aktivitat hat. Ein geeigneter Promoter ist z.B. der Tet-Promoter. 
In einer besonders bevorzugten Ausfuhrungsform kodiert der CAI-Vektor 
zusatzlich ein Gen fur ein regulatorisches Protein, welches den Promoter 
reguliert, in diesem Fall, z.B. den Tet-Repressor, welcher durch ein exogenes 
Oder extrazellulares Signal, wie z.B. Tetrazyklin, gesteuert werden kann. Der 
CAI-Vektor der besonderen Ausfuhrungsform von Abbildung 1 enthalt 
weiterhin ein oder mehrere selektionierbare Markergene sowie zwei 
Replikationsurspriinge (ori), einen fur den zu untersuchenden 
Mikroorganismus (hier als Pathogen bezeichnet) und einen weiteren fur 
einen ublichen Klonierwirtz.B. E.coli. MitHilfe solcher CAI-Vektoren konnen 
aus ganzen mikrobiellen Genomen Antisense-Bibliotheken erstellt werden. 

Abbildung 2 zeigt eine schematische Darstellung eines bevorzugten CAI- 
Verfahrens. Von einem CAI-Plasmid, das kleine Fragmente einer 
genomischen Bank des zu untersuchenden Mikrooganismus enthalt, wird 
asRNA von einem induzierbaren Promoter (P,) aus, unter Kontrolle eines 
extrazellularen Signals synthetisiert (siehe Abb. 1). Die asRNA hybridisiert 
sequenzspezifisch mitder mRNA desjenigen Gens, das dem klonierten DNA 
Fragment auf dem CAI Plasmid entspricht. Durch die Bildung des asRNA- 
mRNA Hybrids wird die Translation dieser mRNA reduziert oder verhindert. 
In Folge entsteht ein defizienter Mikroorganismus, der nicht in der Lage ist, 
daft betreffende Genprodukt zu bilden. Handelt es sich urn das Produkt 
eines essentiellen Gens, dessen Bildung inhibiert wird (A), ist die 
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Lebensfahigkeit des entsprechenden Klons eingeschrankt oder verhindert. 
Die Lebensfahigkeit des Mikroorganismus wird im folgenden anhand seiner 
Lebens- oder Uberlebens- oder Vermehrungsrate in einem definierten 
biologischen System bestimmt. Bei nicht erfolgender Induktion der asRNA 
Synthese (B), oder wenn das CAI-Plasmid das Fragment eines nicht- 
essentiellen Gens enthalt (C), ist der Klon des Mikroorganismus normal 
lebens- und vermehrungsfahig. 

In besonders bevorzugten Ausfuhrungsformen des CAI-Verfahrens werden 
ganze Antisense-RNA-Plasmidbanken aus genomischen Fragmenten des zu 
untersuchenden Mikroorganismus analysiert (siehe Abbildung 3). Eine 
genomische Bank mit CAI-Plasmiden (siehe Abb. 1) wird in den zu 
untersuchenden homologen Mikroorganismus unter nicht-induzierenden 
Bedingungen iibertragen und die plasmidtragenden Klone uber einen 
plasmidkodierten Marker selektioniert. Die Lebensfahigkeit der einzelnen 
Klone, die jeweils ein bestimmtes CAI Plasmid aus der Genbank erhalten, 
wird anschlie&end anhand ihrer Vermehrungsrate unter induzierten bzw. 
nicht induzierten Bedingungen ( + und - in der Abbildung), bezogen auf die 
asRNA Synthese, im direkten Vergleich untersucht. In Klonen, die sich unter 
asRNA induzierenden Bedingungen kaum oder nur langsam vermehren, wird 
die Translation von mindestens einem essentiellen Gen verhindert. Aus 
diesen Klonen werden die CAI-Plasmide isoliert. Die essentiellen Gene 
werden durch Sequenzierung der genomischen Fragmente in den isolierten 
CAI-Plasmiden identifiziert. 

Dieser Ansatz laRt sich auch bevorzugt mit einem subtraktiven Verfahren 
kombinieren (SCAI), von dem eine Ausfuhrungsform zur Veranschaulichung 
in Abb. 4 dargestellt ist. Eine genomische Bank mit CAI-Plasmiden (siehe 
Abb. 1 und 3) wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen und die entstehenden individuellen Klone werden als bakterielle 
CAI-Bank in einem Pool zusammengefaBt. Dieser Pool wird zur Selektion in 
zwei identische Gruppen (den Driver- und den Tester-Pool) aufgespalten. 
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Der hohe Wirkungsgrad des CAI Verfahrens bei der Inaktivierung von 
Einzelgenen in einem Organismus ergibt sich aus der uberlappenden 
Klonierung kleiner genomischer Fragmente und der damit einhergehenden 
Synthese unterschiedlicher asRNA Abkommlinge fur einen bestirnmten 
Genbereich. Auf diese Art wird die Wahrscheinlichkeit, eine asRNA zu 
erhalten, welche die Translation des gesuchten Zielgens effizient inhibiert, 
stark erhoht. Derartige Untersuchungen konnen auf das komplette Genom 
eines Pathogens ausgerichtet werden, was die Uberprufung einer sehr 
groBen Anzahl individueller genomischer Fragmente erforderlich macht. Hier 
sind apparative Hilfsmittel (Roboter) von Vorteil, urn einen hohen 
Probendurchsatz zu erzielen. Allerdings konnen in diesen Fallen nur 
bestimmte Zustande untersucht werden, z. B. das Wachstum der Zellen in 
einem bestirnmten Medium. 

Durch den zusatzlichen Einsatzsubstraktiver Verfahrensschritte (Subtractive 
Conditional Antisense Inhibition, SCAI), kann die Anzahl der zu 
untersuchenden individuellen Klone bevorzugt stark reduziert werden. 

Die Subtraktive Rekombinationsmutagenese (SRM) wird bevorzugt zur 
Identifizierung fakultativ essentieller Gene herangezogen. Im Unterschied 
zum CAI-Verfahren werden dauerhafte Genmutationen erzeugt, wobei die 
Anreicherung essentieller Gene uber einen substraktiven Schritt erreicht 
wird. Die SRM Methode kann wie das CAI Verfahren mit Genbanken von 
pathogenen Mikroorganismen durchgefuhrt werden. 

Das SRM Verfahren beruht auf der Inaktivierung einzelner Gene im Genom 
eines Pathogens durch vollstandige Insertion eines bestirnmten 
Suizidplasmids, wobei dieses ein Teil einer Genbank ist. Die Insertion der 
Plasmide in das Genom erfolgt, durch homologe Rekombination. Die 
erfolgreiche Insertion wird durch Expression eines plasmidkodierten 
Antibiotikum-Resistenzmarkers angezeigt. 
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Eine bevorzugte Ausfuhrungsform der SRM-Methode wird anhand der 
Abbildungen 5 bis 8 veranschaulicht. 

In Abbildung 5 ist ein geeigneter SRM-Vektor dargestellt, der wie der CAI- 
Vektor ein genomisches oder subgenomisches DNA-Fragment des zu 
untersuchendenMikroorganismusenthal^sowieeinenReplikationsursprung 
(ori) fur einen Klonierwirt (z.B. E.coli) # ein oder mehrere selektionierbare 
Markergene und einen weiteren konditional aktiven Replikationsursprung fur 
den zu untersuchenden Mikroorganismus, z.B. einen temperatursensitiven 
Ursprung oder einen Ursprung, dessen Aktivitat von einem in trans 
vorhandenen Replikationsfaktor abhangig ist und der zusatzlich in das 
System eingebracht werden kann. Dadurch daS das SRM-Plasmid eine 
genomische Sequenz des zu untersuchenden Mikroorganismus enthalt, 
kommt es bei Transfektion dieses Vektors in diesem Mikroorganismus zu 
einer homologen Rekombination, bei der das gesamte SRM-Plasmid in das 
genomische Gen des Mikroorganismus inseriert wird und das entsprechende 
Gen, fall es sich um ein solches handelt, inaktiviert. Dies fuhrt zu einer 
Insertionsmutante. Geeignete induzierbare Replikationsursprunge sind, wie 
erwahnt, temperatursensitive oris oder solche, die durch einen Faktor 
gesteuer werden konnen, wie z.B. den RGK-Faktor pir oder den pWV Faktor 
rep A, der in trans dem System zugefuhrt wird. 

Die Insertion eines SRM-Plasmids (siehe Abb. 5) in das Genom des zu 
untersuchenden Mikroorganismus erfolgt uber homologe Rekombination 
zwischen dem im Plasmid klonierten genomischen Fragment des 
Mikrooganismus und der kompiementaren, genomischen DNA Sequenz. 
Nachdem das Plasmid in den entsprechenden Mikroorganismus uberfuhrt 
worden ist, werden unter nicht permissiven Bedingungen, d.h. bei inaktivem 
ori, diejenigen Klone uber Selektion auf den plasmidkodierten Marker isoliert, 
in welchen das SRM-Plasmid in das Genom inseriert ist. Die Exzision des 
SRM-Plasmids erfolgt ebenfalls uber homologe Rekombination. Unter 
permissiven Bedingungen wird die Replikation des insertierten Plasmids 
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eingeleitet, wodurch genugende Mengen an freiem Plasmid in den Zellen 
entstehen, so date das Plasmid aus dem Klon wieder isoliert werden kann. 
Sofern die Insertion eines SRM-Plasmids in ein essentielles Gen 
stattgefunden hat, wird die Lebensfahigkeit des betreffenden Klons 
eingeschrankt (A), wahrend Mutanten in nicht-essentiellen Genen normal 
lebensfahig sind (B). 

Ebenso wie beim CAI-Verfahren kann eine Bank von Insertionsplasmiden 
aus genomischen Fragmenten des zu untersuchenden Mikroorganismus in 
diesen Mikroorganismus ubertragen werden und genomische 
Insertionsmutanten gebildet werden. Diese bevorzugte Ausfuhrungsform des 
SRM-Verfahrens ist in Abbildung 7 dargestellt. Eine Bank von SRM- 
Plasmiden, die einzelne genomische oder subgenomische Fragmente 
enthalten, wird in den zu untersuchenden, homologen Mikroorganismus 
ubertragen. Unter Bedingungen, welche die Plasmidreplikation nicht 
erlauben, werden genomische Insertionsmutanten mit Hilfe eines 
plasmidkodierten Markers (siehe Abb. 5) selektioniert. In diesem Schritt 
konnen nur Insertionsmutanten uberleben, die in einem nicht- oder fakultativ 
essentiellen Gen mutiert sind, da Mutanten eines essentiellen Gens nicht 
lebensfahig sind. Die individuellen Insertionsmutanten werden in einem Pool 
zusammengefatet und dieser Pool anschlieSend in zwei identische Gruppen, 
den Driver- und den Tester-Pool, aufgeteilt. Der Driver-Pool wird 
selektioniert, z.B. durch die Infektion eines Tiers. Der Tester-Pool bleibt 
unbehandelt. Durch die Selektion gehen solche Klone aus dem Driver-Pool 
verloren, die eine Insertion in einem fakultativ essentiellen Gen (das fur das 
Uberleben und die Vermehrung unterden Selektionsbedingungen notwendig 
ist) enthalten. Anschliefcend werden aus den uberlebenden Klonen beider 
Pools, die in das Genom des Mikroorganismus inserierten Plasmide unter 
permissiven Bedingungen rezirkularisiert und zuruckgewonnen. In dem 
Driver-Pool fehlen solchen Plasmide, die Fragmente von fakultativ 
essentiellen Genen enthalten. Die in den SRM Plasmiden klonierten 
Fragmente werden in beiden Pools anschlie&end uber PCR amplifiziert (siehe 
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Abb. 4). Diejenigen amplifizierten DNA Fragmente, die Teile von fakultativ 
essentiellen Genen darstellen, werden durch genetische Subtrakion (siehe 
Abb. 8) angereichert und isoliert. 

Eine besondere Ausfiihrungsform, welche sich eine subtraktive 
Hybridisierung zur Anreicherung in Fragmenten essentieler Gene zunutze 
macht, ist in Abbildung 8 beispielhaft veranschaulicht. 

A: PCR-basierte genetische Subtraktion. Die Tester DNA-Fragmente 
(siehe Abb. 4 und 7) werden mit einem Adapteroligonukleotid in 
solcher Weise ligiert, da& der Adapter nur mit einem der beiden DNA 
Strange eines doppelstrangigen Tester DNA Fragments kovalent 
verbunden ist, was z.B. durch die Ligation eines doppelstrangigen, 
nicht phosphorylierten Adapters an die 3'-phosphorylierten DNA 
Fragmente der Tester DNA erreicht wird. Diese Tester DNA 
Fragmente werden dann mit einem molaren Uberschuss an Driver 
DNA Fragmenten gemischt. Die Mischung wird denaturiert und 
langsam rehybridisiert. AnschlieBend werden uberhangende 
Einzelstrangenden mit DNA Polymerase zum Doppelstrang aufgefullt. 
Die Produkte dieser Reaktion werden mittels PCR amplifiziert, wobei 
Oligonukleotid Primer verwendet werden, die den Adaptersequenzen 
entsprechen. Nur solche Tester DNA Fragmente, die nicht mit Driver 
DNA Fragmenten hybridisert haben, werden exponentiell amplifiziert 
somit angereichert und anschlieSend durch Klonierung isoliert. 

'<: Genetische Subtraktion durch physikalische Abtrennung von 
biotinylierten DNA Fragmenten. Die Driver DNA Fragmente werden 
biotinyliert und anschlieSend im OberschuS mit Tester DNA 
Fragmenten gemischt, denaturiert und langsam rehybridisiert. Die 
biotinylierten Homo- Driver-Driver Doppelstrange und Heteroduplexe 
(Driver-Tester Doppelstrange) werden durch Extraktion mit Trager- 
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gekoppeltem Streptavidin von den Tester-Tester Homoduplexen 
abgetrennt. Letztere werden durch Klonierung isoliert. 

Die beispielsweise durch SRM erzeugten Insertionsmutanten werden in 
Tierversuchen oder Zellkultursystemen hinsichtlich ihrer veranderten 
biologischen Eigenschaften untersucht. Durch die gezielte Verwendung 
spezieller Wirtszellen, z.B. kultivierte Makrophagen oder Wirtsgewebe, z. B. 
Milz, konnen Gengruppen selektiert werden, die essentielle Eigenschaften 
des Pathogens determinieren, z.B. die Besiedlung bestimmter Wirtszellen. 
Isoliert man die uberlebenden Mutanten aus den Zellen, so fehlen die 
Mutanten essentieller Gene. Subtrahiert man aus der kompletten Genbank, 
die uberlebenden Mutanten, so erhalt man die Mutanten der essentiellen 
Gene. Dies geschieht uber einen speziellen PCR-basierten 

Substraktionsschritt. 

Das CAI- bzw. das SRM-Verfahren ist eine sehr effiziente Methode zur ein- 
deutigen Identifizierung und Charakterisierung essentieller Gene. Da essen- 
tielle Gene ein naturliches Ziel fur inhibierende Wirkstoffe darstellen, bieten 
die dargestellten Verfahren eine ideale Grundlage fur die Entwicklung neuer 
Wirkstoffe. 

In den nachfolgend beschriebenen Verfahren werden die identifizierten Gene 
direkt zum Wirkstoff-Screening eingesetzt, wobei im Vergleich zu herkomm- 
lichen Verfahren, auf aufwendige Aufreinigungsschritte verzichtet werden 
kann. Im Mittelpunkt dieser Verfahren stehen bakterielle Tragerzellen, die 
zum Screening nach prophylaktischen und therapeutischen Wirkstoffen 
eingesetzt werden konnen. 

Die hergestellten gendefizienten Mikroorganismen werden dann auf ihre 
Wachstumsfahigkeit oder ihre Uberlebensfahigkeit getestet. Geeignete 
Testsysteme sind z.B. to-wfro-Systeme, Zellkultursysteme, Gewebekultur- 
systeme und Tiermodelle als naturliche Umgebung. Wird das Verfahren bei 
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H. pylori angewandt, werden die Organismen einerseits auf einem sog. 
Vollmedium angezuchtet, wobei das Vollmedium die bestmoglichen Voraus- 
setzungen fur ein Wachstum fur H. pylori ermoglicht. Gleichzeitig werden die 
defizienten H. pylori Organismen in einer Kultur gezuchtet, welche der 
naturlichen Umgebung von H. pylori moglichst genau entsprechen soil. Es 
werden hierzu einerseits Zellkulturen basierend auf Primarkulturen oder 
Zellinien aus gastrointestinalem Gewebe verwendet oder aber ausdifferen- 
ziertes Primargewebe (Spharoide) in Kulturmedium. Weitere Moglichkeiten 
zur Simulation der naturlichen Umgebung von H. pylori bestehen in der 
Verwendung von stimulierten Makrophagen, denn H. pylori besitzt die 
Fahigkeit, von diesen nicht aufgenommen und metabolisiert zu werden. 
Aufcerdem kann auch uberpruft werden, ob die defizienten H. pylori 
Organismen in der Lage sind, sich in immundefizienten Mausen uber einen 
bestimmten Zeitraum zu etablieren. 

1st ein defizientes H. pylori Bakterium zwar in der Lage, auf Vollmedium zu 
uberleben, wachst aber nicht in einer naturlichen Umgebung, wie oben 
beschrieben, so wird das in diesem Organismus defiziente Gen als fakultativ 
essentielles Gen bezeichnet. 

Wenn der defiziente H. pylori Organismus in keinem der beiden Testlebens- 
raume uberlebensfahig ist, so handelt es sich um ein obligat essentielles 
Gen. 

Allgemein konnen Gene von Mikroorganismen einer dieser Kategorien 
zugeordnet werden. 

Aus diesen Ergebnissen konnen dann die in mutierten oder/durch asRNA 
unterdruckten Sequenzen identifiziert und jeweils einer dieser beiden 
Kategorien zugeordnet werden, oder aber der Kategorie der nichtessentiellen 
Gene, wenn der gendefiziente Organismus keine Beeintrachtigungen in 
seiner Wachstumsfahigkeit zeigt. 
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Eine weitere Aufgabe der vorliegenden Erfindung ist es, ein genetisches 
Verfahren zur Isoiierung und Klonierung der identifizierten essentiellen Gene 
aus verschiedenen klinischen Helicobacter Isolaten bzw. aus heterologen 
pathogenen Keimen von klinischer Bedeutung bereitzustellen. Das 
erfindungsgemaGe Verfahren umfafct daher weiterhin die Schritte 
(v) Herstellen von Primern zur Amplifikation und Detektion von 

homologen Gensequenzen in heterologen Mikroorganismen 
(VI) Identifizieren der homologen Gensequenzen. 

Eine bevorzugte Durchfuhrung dieser weiteren Verfahrensschritte besteht 
darin, sogenannte Megaprimer von den identifizierten essentiellen 
He/icobacter-Genen mittels PCR (Polymerase Chain Reaction) herzustellen, 
deren Sequenz direkt aus den entsprechenden Plasmiden der 
mutagenisierten DNA-Abschnitte abgeleitet werden kann. Diese Primer 
konnen dann verwendet werden, urn die bereits identifizierten essentiellen 
Gene aus verschiedenen Helicobacter-\so\aten zu isolieren. Falls diese 
essentiellen Gene Entsprechungen in anderen Mikroorgansimen haben, 
konnen die Primer unter Umstanden auch zur Isoiierung dieser Gene aus von 
A/e//co£acrerverschiedenen Mikroorgansimen verwendet werden. Weiterhin 
kann dann die genaue DNA-Sequenz der isolierten Gene und die Feststellung 
der Genvarianz innerhalb der verschiedenen Helicobacter-\$o\a\e bzw. 
zwischen den verschiedenen Mikroorganismen bestimmt werden. 
Bei der Herstellung der Megaprimer entstehen DNA-Fragmente mit variablen 
3'-Enden. Aufgrund dieser Eigenschaft ist es moglich, die DNA-Fragmente 
zur Isoiierung variabler, bzw. verwandter Gene mittels des beschriebenen 
PCR-Verfahrens einzusetzen. 

identifizieren von spezifischen Wirkstoffen 

Zur Identifizierung neuer immunologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe werden bakterielle Trager insofern sehr 
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wirksam eingesetzt, da die identif izierten Gene direkt in diese Tragersysteme 
kloniert und dort exprimiert werden konnen. Das Wirkstoff-Screening 
erfolgt dann direkt mit Hilfe dieser rekombinanten, bakteriellen Trager. Als 
Trager werden bevorzugt attenuierte Bakterien, wie z.B. Salmonellen, 
verwendet, da diese uber ein naturliches Potential zur Immunstimulanz 
verfugen. Werden diese attenuierten Bakterien als Trager bzw. 
Produzenten fur die identifizierten essentiellen Gene der pathogenen Keime 
verwendet und wird mit diesen Impfstammen eine Immunisierung an einem 
Saugetier durchgefuhrt, so kann eine nachhaltige Immunantwort ausgelost 
werden. 

Mittlerweile sind die immunologischen Eigenschaften dieser bakteriellen 
Tragersysteme so weit verfeinert worden, da& eine gezielte Immunantwort 
ausgelost werden kann (VanCott et al., 1998; Carrier-Patent EP981 1 6827. 
1). Diese Eigenschaft ist insofern bedeutsam, da die verschiedenen 
Krankheitserreger oftmals nur uber einen bestimmten Zweig des 
Immunsystems wirksam bekampft werden konnen. D.h. schutzvermittelnde 
Antigene lassen sich nur dann identifizieren, wenn sie dem Immunsystem 
in der richtigen Form prasentiert werden. Nur wenn der verwendete Trager 
mit einem wirksamen Antigen beladen wurde, kann es zu einer 
Schutzwirkung kommen. Aufgrund der vielfaltigen immunologischen 
Eigenschaften bakterieller Tragersysteme und deren Uberlegenheit 
gegenuber herkommlichen synthetischen Adjuvantien sind diese zur 
Identifizierung immunologisch relevanter Antigene besonders geeignet. 

Daruber hinaus konnen die bakteriellen Tragersysteme mit effizienten 
Genexpressionssystemen ausgestattet werden, welche die Herstellung auch 
problematischer Antigene erlauben (PCT/EP9 1/02478, EP981 1 6827. 1 ). 
Aufgrund der direkten Subklonierung der isolierten essentiellen Gene und 
der einfachen Handhabung der bakteriellen Trager bei der Herstellung und 
Vakzinierung, konnen in relativ kurzer Zeit eine grofce Anzahl von Antigenen 
hinsichtlich ihres immunogenen und protektiven Potentials durchgetestet 
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werden. In herkommlichen Verfahren mussen die Test-Antigene dagegen 
zeitaufwendigen Aufreinigungsverfahren unterworfen werden, wobei 
oftmals schon bei der gentechnischen Herstellung der ausgewahlten 
Antigene in Bakterien Schwierigkeiten auftreten, die mit der toxischen 
Wirkung dieser Antigene auf den produzierenden Bakterienstamm verknupft 
sind. 

Eine wichtige Voraussetzung ftir das Entwickeln von Wirkstoffen besteht 
darin, das immunogene Potential der identifizierten Sequenzen festzustellen, 
urn zu bestimmen, inwiefern die entsprechenden Genprodukte fur die 
Herstellung von Antikorpern oder Impfstoffen geeignet sind. 

Zur Identifizierung immunologischer Wirkstoffe gegen klinisch relevante 
Hef/cobacter-Organismen muB zunachst ermittelt werden, in wie weit das 
Genprodukt des identifizierten essentiellen Gens immunogene Eigenschaften 
besitzt. D.h. es muB experimentell ermittelt werden, ob mit dem Antigen 
eine humorale und zellulare Immunantwort in einem Saugetier ausgelost 
werden kann, die gegen das originale Genprodukt des Erregers gerichtet ist. 
Damit werden auf keinen Fall solche Antigene ausgeschlossen, die im 
Rahmen einer natiirlichen Infektion vom Immunsystem nicht erkannt 
werden. Im Gegenteil, vielmehr konnte man erwarten, date z.B. bei 
chronischinfizierten Menschendie Immunantwort gegen schutzvermittelnde 
Antigene unterdruckt ist oder von einer Qualitat ist, die letztendlich keine 
Schutzwirkung vermittelt. AuszuschlieRen sind jedoch solche Antigene, die 
einer hohen genetischen Variation unterliegen und somit einer wirksamen 
Immunantwort kaum zuganglich sind. 

Zum Nachweis der Identitat des identifizierten Genprodukts bei einer 
naturlich vorkommenden Infektion, wird Antiserum von Patienten 
gewonnen, die entweder unter einer aktiven Gastritis mit Beschwerden 
leiden, oder aus Patienten, bei denen die He//cobacter-\nfekt'\on symptomlos 
verlauft. Mit diesen Seren wird das elektrophoretisch aufgetrennte 
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rekombinante Protein in einem klassischen Western Blot Verfahren getestet. 
Findet eine Erkennungsreaktion mit einem rekombinanten Protein jeweils mit 
beiden Seren, also dem eines Patienten mit einer fulminanten und dem eines 
Patienten mit einer symptomlosen Helicobacter Infektion, statt, so spielt 
dieses Protein bei einer naturlichen Infektion eine Rolle. Wird das 
rekombinante Polypeptid dagegen nur von dem Serum des Patienten mit 
einer symptomlosen Infektion erkannt, kann das zusatzlich ein Hinweis auf 
ein protektives Potential des entsprechenden Proteins sein. Weiterhin 
konnen Antikorper, die gegen dieses Protein spezifisch gerichtet sind, 
moglicherweise zur passiven Immunisierung eingesetzt werden. 

Von besonderem Interesse sind aufSerdem Antikorper von Individuen, die 
nachweislich keine He/icobacter-Trager sind, da diese auf ein protektives 
Potential eines entsprechenden rekombinanten Polypeptids schliefcen lassen. 

Desweiteren werden die immunogenen Polypeptide zusammen mit 
geeigneten Zusatzstoffen zur Immunisierung in vivo eingesetzt. Verwendet 
werden dazu verschiedene Adjuvantien, bakterielle Toxine, Zytokine oder 
ein erfindungsgema&es Polypeptid als Lebendvakzin. Die Immunantwort 
wird daraufhin getestet, ob sie nach einer erfolgten Verabreichung eines 
bestimmten Polypeptids der Erfindung in Kombination mit entsprechenden 
Zusatzstoffen nach Infektion mit dem homologen Keim eine schutzende 
Wirkung gegen weitere homologe Infektionen herbeifuhrt (z.B. Infektionen 
mit verschiedenen H. pylori Stammen). 

Noch eine weitere Moglichkeit zum Testen der Immunogenitat besteht darin, 
im Tiermodell (z.B. Maus, Kaninchen) eine Immunantwort gegen 
Helicobacter oder andere Mikroorganismen auszulosen und aus den 
immunisierten Tieren Antikorper zu gewinnen, die dann in einer weiteren 
Western-Blot-Analyse verwendet werden konnen. Gleichzeitig mussen 
Patientenbiopsien in situ immunologisch mit den gleichen Antikorpern 
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untersucht werden, da Helicobacter und andere Mikroorganismen in Kultur 
bestimmte Proteine verlieren oder hinzugewinnen konnen. 

Parallel dazu ist es bevorzugt zu untersuchen, ob gegen eine Infektion mit 
heterologen Keimen (bevorzugt andere gram-negative Bakterien), welche 
das entsprechende Polypeptid exprimieren, eine schutzende Wirkung erzielt 
werden kann. 

Nachdem festgestellt wurde, ob die identifizierten Gene bzw. deren 
Expressionsprodukte in der Lage sind, eine Immunantwort hervorzurufen, 
kann gemafc dem Verfahren der Erfindung weiterhin untersucht werden, ob 
auch eine bereits bestehende Infektion mit derartigen Antigenen behandelt 
werden kann. Kann auf diese Weise ein Polypeptid identifiziert werden, das 
eine therapeutische Wirkung zeigt, wird es bevorzugt auch auf seine 
Aktivitat bei Infektionen mit heterologen Keimen untersucht. 

Das Screening nach prophylaktisch bzw. therapeutisch wirksamen, 
immunologischen Stoffen kann nach folgendem Schema verlaufen, wobei 
die Einhaltung der einzelnen Schritte nicht zwingend ist: 
1 ■ Klonierung des identifizierten Gens in einen geeigneten bakteriellen 
Tragerstamm und Nachweis sowie Quantifizierung des vollstandigen 
Genprodukts durch SDS-PAGE. 
2. Immunologische Charakterisierung des erzeugten Genprodukts mit 
Hilfe von (a) Seren infizierter oder/und naturlich geschutzter Wirte, 
die das Genprodukt im Tragerstamm erkennen sollte; (b) 
Hyperimmunseren von Tieren, die mit dem rekombinanten 
Tragerstamm immunisiert wurden. Wobei das jeweilige 
Hyperimmunserum das originale Genprodukt im pathogenen Keim 
erkennen sollte. Hierbei kann es moglich sein, daS das originale 
Antigen nur in einem bestimmten Entwicklungszeitraum vom 
Pathogen produziert wird. 
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3. Die protektive Wirkung der individuellen Antigene in der 
prophylaktischen oder/und therapeutischen Anwendungsform wird im 
Tiermodeil untersucht. 

Alle protektiven Antigene, die mitden beschriebenen Verfahren identifiziert 
wurden, konnen nunmehr in einem zweiten Schritt weiterentwickelt werden . 
Im Vordergrund dieser Weiterentwicklung steht u. a. die Evaluierung der 
genetischen Konstanz der identif izierten protektiven Antigene innerhalb des 
Pathogens bzw. verwandter pathogener Keime in seiner weltweiten 
Verbreitung. Weiterhin wird zur Entwicklung wirksamer Impfstoffe, auf die 
genetischen Unterschiede im Immunsystem der Impflinge eingegangen. Ziel 
beider Verfahren ist die Identifizierung von Antigenen oder Epitopen, die 
moglichst breit angewendet werden konnen. Zur Erfassung der 
Genvariabilitat innerhalb einer Spezies bzw. homologer Keime kann der 
sogenannte Mega-Primer-Ansatz eingesetzt werden. Aus dem Plasmid mit 
dem relevanten Gen werden direkt genspezifische Primer mit variablen 3'- 
Enden uber PCR hergesteilt, welche die Amplifikation homologer Gene 
ermdglichen. Anhand der ermittelten DNA-Sequenz der amplifizierten Gene 
kann deren Variability abgeleitet und z.B. genkonstante Bereiche bestimmt 
werden. 

Die genetischen Unterschiede zwischen einzelnen Impflingen, auf ein 
definiertes Antigen zu reagieren, kann mit Hilfe einer In WYro-Vakzinierung 
evaluiert werden. Aus unterschiedlichen Spendem werden hierzu 
antigenprasentierendeZellen(APC) isoliert,z.B.dentritischeVorlauferzellen, 
welche in vitro expandiert und mit den zu testenden Antigenen beschickt 
werden, wobei die Antigene bevorzugt uber entsprechende Vektoren 
exprimiert werden. Die identifizierten Gene konnen auch einzeln oder in 
definierten Kombinationen in dendritischen Zellen (DC) von nicht infizierten 
Spendern exprimiert werden. Dabei werden die Genprodukte von der 
Wirtszelle prozessiert und durch den MHC-Komplex prasentiert. DC sind 
besonders fur die Antigenprasentation gegeniiber naiven oder 
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"schlummernden" T-Zellen geeignet. Werden DC mit T-Zellen autologer 
Spender inkubiert, ist es moglich zu bestimmen, ob dieser Spender gegen 
das eingesetzte Antigen reagieren wurde, wenn er auf naturliche Weise 
damit in Kontakt kame, z.B. im Rahmen einer Schutzimpfung. Anhand der 
Immunantwort der T-Zellen kann auf eine mdgliche Immunogenitat des 
entsprechenden Antigens geschlossen werden. Eine solche Immunantwort 
besteht beispielsweise aus einer Proliferation der T-Zellen, bzw. einer 
Zytokin-Ausschuttung insbesondere von IL-2 und IL-4. Die Zytokine konnen 
beispielsweise mit Hilfe eines kommerziell erhaltlichen Assaykits (z.B. von 
Genzyme Cambridge M.A.) ausgewertet werden. 

SchlielSlich konnen die in der beschriebenen Weise identifizierten und 
charakterisierten Antigene bzw. Epitope zur Entwicklung der ersten 
Impfstoff-Prototypen eingesetzt werden. Hierbei wird zwischen zwei 
Impfstofftypen unterschieden, der aktiven und der passiven Impfung. 

Zur passiven Immunisierung, werden dem Impfling Antikorper oder 
Antikorperfragmentemitschutzenderbzw. inhibierender Wirkung vonauSen 
zugefuhrt. 

Antikorper werden in Form von polyklonalen, bevorzugt monoklonalen 
Antikorpern (MAKs) oder rekombinanten Antikorpern bereitgestellt. Hierzu 
gehoren Antikorper, die spezifisch mit Polypeptiden der Erfindung oder 
deren Untereinheiten und Fragmenten reagieren und fur eine prophylaktische 
und/oder therapeutische Anwendung, z.B. einer passiven Immunisierung, 
verwendet werde konnen. Diese Anti-Protein- oder Anti-Peptid-Antiseren 
bzw. monoklonalen Antikorper konnen mit Hilfe von Standardprotokollen 
z.B. durch die Immunisierung von Tieren wie Mausen, Ratten oder Ziegen 
mit einem gereinigten Polypeptid der Erfindung, einen Fusionsprotein oder 
einem Subfragment dessen hergestellt werden. Daruber hinaus konnen die 
Tiere auch mit bakteriellen Vakzinetragern immunisiert werden, die mit 
entsprechenden Genen der Erfindung ausgestattet sind und die kodierten 
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Polypeptide exprimieren. Die Antikorper sind dabei bevorzugt 
immunspezifisch gegen antigene Determinanten oder Epitope hierzu der 
beschriebenen Heficobacter-Po\ypept\de oder einem eng verwandten 
Polypeptid, das eine Homologie von mindestens 90% besitzt, gerichtet. Sie 
sind nicht kreuzreaktiv mit Polypeptides die z.B. eine Homologie von 
weniger als 80% aufweisen. 

Ausgehend von einer Zellinie, die einen Polypeptid-spezifischen 
monoklonalen Antikorper produziert, kann aus dem kodierenden Gen eines 
solchen Antikdrpers, chimare Gene geschaffen werden, die Antikorper 
determinieren, bestehend aus einer Antigen bindenden Domane aus der 
Maus und dem Fc-Teil eines Antikdrpers des Menschen. Diese Antikorper 
konnen in Zellinien oder transgenen Tieren produziert werden. 

Anstelle von Antikdrpern, die im Tier generiert wurden, konnen auch 
Antikorper-Fragmente, Miniantikdrper, verwendet werden, die z.B. in einem 
heterologen System wie Bakterien hergestellt werden. Diese Miniantikorper 
konnen entweder monovalent oder bivalent sein und bestehen aus 
dimerisierten Einzelketten-Molekulen (Kujau et al., 1998; Kalinke et al., 
1996; Pack et al., 1993). 

Antikorper gegen die immunogenen Polypeptide der Erfindung konnen auch 
in Pflanzen generiert werden. Beispiele hierzu sind z.B. von Hiatt und Ma 
(1 993), van Engelen etal. (1 994) und Ma etal. (1 994) beschrieben worden. 
Entsprechend der jeweilig verwendeten Pflanze konnen diese z.B. direkt zum 
Verzehr und damit als orales Vakzin verwendet werden. 

Eine weitere, sehr breit anwendbare Weise, Antikorper herzustellen, ist in 
Milch und Eiern immunisierter Tiere. Verabreicht man z.B. trachtigen Kuhen, 
Schafen oder Pferden geeignete Antigene, so finden sich in der Milch 
Immunoglobuline, die zur Entwicklung eines Vakzins verwendbar sind. Die 
Milch kann dann entweder direkt als Vakzin verabreicht werden, oder ein 
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konzentriertes Immunglobulin-Extrakt hergestellt werden. Auf die gleiche 
Weise konnen auch Antikorper (Hyperimmunantikorper) in Huhnereiern 
produziert werden (Ling etal., 1 998; Sasse et al., 1998). Die beschriebenen 
immunogenen Polypeptide der Erfindung konnen daher auch zur Entwicklung 
eines Milchprodukts oder Huhnereiern verwendet werden, die als orales 
Vakzin verwendet werden konnen. 

ErfindungsgemaS werden die generierten Antikorper oder deren Fragmente 
auf ihre Anwendbarkeit getestet. Sie konnen dazu durch bekannte Verfahren 
aufgereinigt werden (Prazipitation, chromatographische Verfahren) und bei- 
spielsweise darauf untersucht werden, ob sie den Infektionsvorgang von H. 
pylori inhibieren konnen (Adhasionsassays) oder aktivierend auf Komple- 
ment oder ADCC ("antibody-dependent cell-mediated cytotoxicity", anti- 
korperabhangige zellvermittelte Zytotoxizitat) wirken. 

Zur passiven Immunisierung werden die Antikorper, die mit Hilfe der 
Polypeptide der Erfindung generiert wurden, entweder oral oder intra- 
gastrisch verabreicht. Hierfur werden die Antikorper mit einem Bicarbonat- 
Puffer gemischt. Sie konnen aber auch systemisch verabreicht werden, 
wobei sie nicht gepuffert werden mussen. 

Antikorper werden bevorzugt allein oder auch in Kombination mit anderen 
nicht-immunologischen Wirkstoffen verwendet, z.B. mit Antibiotika oder 
Protonenblockern. 

Aktive Vakzinierung beruht auf einer Immunreaktion, die vom geimpften 
Organismus selbst ausgelost wird. Bevorzugt sind Darreichungsformen von 
Impfstoffen als Antigene, Antigenfragmente, Subunit-Vakzin, als DNA- 
Vakzin, als Lebend-Vakzin oder als Lebensmittel-Vakzin. 

Antigene sind diejenigen Polypeptide oder deren Fragmente, die in vivo eine 
Immunreaktion hervorrufen konnen. 
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Wenn ein Polypeptid als Subunit-Vakzin bereitgestellt werden soil, wird es 
zunachst in seine Untereinheiten bzw. Strukturdomanen gemaB seines 
Antigenitatsmusters zerlegt (z.B. T- und B-Zell-Epitope). Dieses 
Antigenitatsmuster kann mit Hilfe eines Computerprogramms erstellt 
werden, wobei immunogene Regionen, die aus einer kurzen Polypeptid- 
sequenz von ca. 8 bis 10 Aminosauren bestehen, erkannt werden konnen 
(Hughes et aL, 1992). Die einzelnen Polypeptidstucke konnen dann 
anschlieSend auf ihre Immunogenitat in der Maus oder in Primaten bzw. den 
Menschen getestet werden. Sie konnen dazu entweder als gereinigte 
Polypeptide, die synthetisch hergestellt wurden, in Kombination mit 
entsprechenden Zusatzstoffen wie einem Adjuvans, Toxin oder Cytokin 
verabreicht werden, oder als Fusionsprotein an ein bekannt immunogenes 
Protein bzw. Proteinuntereinheit wie z.B. die Cholera Toxin B Untereinheit 
(Liljeqvist et aL, 1997) gekoppelt. Weiterhin konnen die immunogenen 
Peptide in auSere Membranproteine wie z.B. dem OmpS Maltoporin von 
E.coli eingebaut und heterolog in einem Vakzin-Tragerstamm exprimiert 
werden (Lang und Korhonen, 1997). 

Zur Entwicklung eines DNA-Vakzins konnen die in der Erfindung 
charakterisierten Polynukleinsaure-Molekule "nackt" in Fusion mit einem 
eukaryontischen gewebespezifischen Promoter oder in Form eines Plasmids 
verabreicht werden. Die "nackte" DNA oder das entsprechende Plasmid 
wird in Kombination mit einem Zusatzstoff wie einem Reagenz, das die 
zellulare Perrneabilitat verandert wie z.B. Bupivacain (W094/1 6737), 
kationischen Lipiden wie z.B. DOTMA (N-[1-(2,3-dioleyloxy)propyl]-N / N,N- 
trimethyl-ammoniumchlorid, DOTAP (1 ,2-bis(o!ey!oxy)-3-trimethyl- 
ammonio)propan), DDAB (dimethyl-dioctadecyl-ammoniumbromid), DOGS 
(dioctadecyl-amidolglycyl-spermidin) bzw. Cholesterinolderivaten, Silica, 
Gold oder Wolfram (Tang et aL 1992) bzw. in Liposomen (W093/18759, 
W093/19768, WO94/25608, W095/2397) oder Mikropartikeln verpackt, 
verabreicht. Beispiele fur brauchbare Promoteren und Genfahren sind von 
Hartikka et aL (1996) beschrieben worden. Zur Applikation der 
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Polynukleotid-Molekule konnen jedoch auch z.B. attenuierte Salmonellen 
verwendet werden. Die Bakterien werden hierfur mit eukaryontischen 
Expressionsvektoren, die ein Polynukleotid-Molekul der Erfindung beinhalten, 
transformiert und dann oral verabreicht. Die Plasmid-DN A wird anschlie&end 
vom Bakterium auf den Wirt ubertragen (Darji et aL, 1997). Zur 
Transformation attenuierter Tragerbakterien konnen jedoch auch filamentose 
Phagen verwendet werden. Der Vorteil dieser liegt darin, date sie eine 
extrem hohe Anzahl von Plasmiden ubertragen konnen. 

Fur die Entwicklung eines Lebendvakzins stehen unter anderem virale, wie 
z.B. adenovirale oder Windpocken-Virus-Vektoren, bzw. bakterielle Vektoren 
wie etwa Salmonella, Shigella oder Lactobacillus zur Verf ugung . Attenuierte, 
nichtvirulente Salmonella typhimurium-Stamme, die zur rekombinanten 
Expression heterologer Antigene benutzt werden konnen und oral 
verabreicht werden, wurden vielfach charakterisiert (Mekalanos, 1994, 
W092/11361, Cirillo et aL, 1995 und Dorner (1995). Weitere bakterielle 
Vektoren, die als Vakzinvektoren verwendet werden konnen, sind von Cirillo 
et aL, (1995) und Dorner (1995) beschrieben worden. Ein Polynukleotid- 
Molekiil der Erfindung, das fur ein therapeutisch oder prophylaktisch 
wirksames Polypeptid kodiert, wird hierzu entweder in das bakterielle 
Genom stabil integriert und einem Transportsystem unterworfen, das die 
Darbietung an der bakteriellen Oberflache ermoglicht (PCT/EP94/04286; 
WO97/35022). Das entsprechende Polynukleotid-Molekul kann im 
Bakterium aber auch als Plasmid in freiem Zustand vorliegen. 

Impfstoffe werden in der Regel mit geeigneten Zusatzstoffen wie z.B. 
Adjuvantien, bakteriellen Toxinen, Zytokinen etc. verabreicht, die das 
immunogene Polypeptid in seiner protektiven oder therapeutischen Wirkung 
unterstutzen. Adjuvantien mit geringen Nebenwirkungen zur Verwendung 
im Menschen, die fur Subunit-Vakzine und Lebend-Vakzine, aber zum Teil 
auch fur DNA-Vakzine in Frage kommen, sind z.B. Aluminiumhydroxid, 
Aluminiumphosphat, Calciumphosphat, N-Acetyl-muramyl-L-threonyl-D- 
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isoglutamin, N-Acetyl-normuramyl-L-alanyl-D-isoglutamin, N-Acetyl- 
muramyl-L-alanyl-D-isoglutamyl-L-alanin-2-(1 '-2'-dipalmitoyl-sn-glycero-3- 
hydroxyphosphoryloxy)-ethylamin, Liposomen, Monophosphoryl-Lipid A, 
Trehalosedimicoloat, Pilz-Polysaccharide wiez.B. Schizophyllan, Muramyl- 
Dipeptid, Muramyl-Dipeptid-Derivate, sowie Phorbolester, Saponine und 
immunstimulierende Komplexe (ISCOMS) (Gupta und Siber, 1995). Als 
bakterielles Toxin kann z.B. Cholera Toxin bzw. dessen Untereinheiten oder 
das hitzelabile Toxin aus E.coli verwendet werden. Obwohl diese 
hochpotent als Adjuvantien aktiv sind, konnen sie aufgrund ihrer Toxizitat 
nur begrenzt auf den Menschen angewendet werden. Mit Hilfe bestimmter 
Mutagenesetechniken konnen jedochMolekuleentwickelt werden, die aktiv, 
aber ungiftig sind (O'Hagan, 1998). 

Eine weitere Moglichkeit, die Immunantwort auf die prophylaktisch und/oder 
therapeutisch wirksamen Substanzen der Erfindung zu optimieren, ist, das 
entsprechende Polypeptid als Fusionsprotein mit einer immunogenen 
Proteindomane zu exprimieren. Eine Moglichkeit besteht z.B. darin, die Pilin 
DSL-Domane aus Pseudomonas aeruginosa als Fusionspartner zu 
verwenden. Weiterhin beschrieben sipd Fusionsproteine, die an Glutathion 
S-Transferase oder Thioredoxin fusioniert wurden (Hill et al w 1997; 
Gabelsberger et al., 1 997). Das entsprechende Fusionsprotein kann jeweils 
als Subunit- oder Lebendvakzin hergestellt und verabreicht werden. 

Die Immunantwort der identifizierten immunologisch wirksamen Substanzen 
kann auch insofern moduliert werden, indem diese in Kombination mit 
bestimmten Zytokinen verabreicht werden. Zur simultanen Verabreichung 
bietet sich eine Co-Expression der Polynukleotid-Sequenzen der Erfindung 
mit einem bestimmten Cytokin in Salmonella oder einem anderen 
Wirtsbakterium an. Das entsprechende Cytokin kann hierzu entweder auf 
einem separaten Plasmid, in Reihe oder als Fusionsprotein mit der 
gewunschten Polynukleotid-Sequenz der Erfindung kodiert sein und dann in 
das Wirtsbakterium transformiert werden. In Frage kommen Cytokine, die 
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wiez.B. lnterleukin-6 (IL-6), lnterleukin-10 (IL-1 0) oder lnterleukin-1 2 (IL-1 2) 
das Immunsystem stimulieren. 

Zur weiteren Optimierung konnen einzelne immunogen wirksame 
Substanzen der Erfindung miteinander oder in Kombination mit bekannten 
immunogenen Substanzen wie z.B. VacA bzw. dessen einzelne 
Untereinheiten kombiniert werden. Das entsprechende Polypeptid kann also 
gemeinsam mit mindestens einem weiteren Helicobacter Antigen, wie z.B. 
der nativen Urase oder deren Untereinheiten, Fragmenten Homologen, 
Mutanten oder Derivaten derselben exprimiert werden. AuSerdem konnen 
z.B. verschiedene Subunit-Vakzine einzeln oder als Fusionsprotein wie 
weiter oben beschrieben gemeinsam verabreicht werden. Hierfur konnen 
wiederum z.B. gereinigte Polypeptid-Molekule in Kombination mit einem 
geeigneten Adjuvans, bakteriellen Toxin oder Cytokin verwendet werden. 
Weiterhin konnen diverse Kombinationen von Nukleotid-Sequenzen 
immunogener Untereinheiten der beschriebenen Polypeptid-Molekule auf 
einem gemeinsamen Plasmid hergestellt und als Lebendvakzin verabreicht 
werden. Ein Vakzinvektor der Erfindung kann also ein oder mehrere 
Polypeptide der Erfindung, Derivate bzw. Fragmente dergleichen enthalten. 
Aufcerdem besteht die Moglichkeit der Kombination eines DNA-Vakzins mit 
ein oder mehreren gereinigten Subunit-Vakzinen in einer geeigneten 
Tragersubstanz, wie bereits weiter oben beschrieben wurde. 

Zur Identifizierung neuer pharmakologischer Wirkstoffe aus dem Pool der 
identifizierten essentiellen Gene eines Pathogens bzw. zur 
Weiterentwicklung dieser Wirkstoffe konnen ebenfalls bakterielle Trager sehr 
wirksam eingesetzt werden, da die identifizierten Gene direkt in diese 
Tragersysteme kloniert und dort exprimiert werden konnen. Das Wirkstoff- 
Screening erfolgt dann direkt mit Hilfe dieser rekombinanten, bakteriellen 
Trager. 



- 42 - 

Display-Systeme dienen dazu, ein exprimiertes Polypeptid der Erfindung an 
der Zelloberflache von Bakterien zu prasentieren. Den Transport von 
Polypeptiden durch die innere Membran ermoglicht ein Signalpeptid am 
Aminoende, wahrend andere Anteile die Einlagerung und Verankerung in der 
au&eren Membran ubernehmen. Als Trageranteile sind verschiedene auISere 
Membranproteine von E.coli beschrieben worden wie z.B. PhoE (Agterberg 
et a/. f ( 1 990) oder OmpA (Francisco et al. , 1 992) . Es konnen jedoch auch 
Fusionen mit der Transportdomane des IgA-Proteasevorlaufers IgAte 
verwendet werden (Klauser et al. , 1 990) . Beispiele fur Display-Systeme sind 
z.B. das DsbA-System (PCT/EP 94/02486) oder das Autotransporter-System 
(AIDA; WO97/35022). Die an der Oberflache prasentierten Polypeptide 
konnen dann fur Bindungsstudien mit Peptid- oder kombinatorischen 
chemischen Substanzenbanken verwendet werden. Die Bindungsstudien 
konnen mit Hilfe eines "High Through Put" Systems, das hohe Testraten 
ermoglicht, in Flussigkeit oder aber gebundener Form durchgefuhrt werden. 
Hierfur werden die prasentierten Polypeptide z.B. an ein Chromatophor 
gekoppelt, das in Kombination mit einem weiteren Chromatophor, das an 
das Wirkstoff-Peptid oder die chemische Substanz gekoppelt ist, eine 
Farbreaktion ermoglicht. Die entsprechende Wirkstoffkomponente kann 
jedoch auch z.B. mit einem Fluoreszenzfarbstoff markiert oder an eine feste 
Tragermatrix gekoppelt sein. Bei Verwendung eines "Solid Phase Systems" 
wird vorher entweder das verwendete Polypeptid der Erfindung oder aber 
umgekehrt die Peptid- bzw. kombinatorische Wirkstoffbank an die 
Tragermatrix gekoppelt. Diejeweiligefarbstoffmarkierte Komponente bindet 
dann an die immobilisierte Komponente, wodurch wieder eine Farbreaktion 
ermoglicht wird. Nach der Bindungsreaktion rnussen dann mehrere 
Waschvorgange vollzogen werden, bevor die entsprechende Substanz 
isoliert wird. Vorteil des "Solid Phase Systems" gegeniiber der Bindung in 
Flussigkeit ist, daS die wirksame Substanz schneller isoliert werden kann, 
da die ungebundenen Substanzen weggewaschen sind. 
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Weitere Verfahren zur Identifizierung neuer pharmakologischer Wirkstoffe 
basieren auf den Kenntnisse aus der Primarstruktur der identifizierten 
essentiellen Gene bzw. benutzen die aufgereinigten gentechnisch 
hergestellten Genprodukte. 

Eine alternative Ausfuhrungsform des erfindungsgemafSen Verfahrens 
besteht darin, spezifische Bindepartner der von den identifizierten Genen 
kodierten Polypeptide zu finden. 

Es konnen bevorzugt Homologiestudien mit Helicobacter und anderen 
Organismen durchgefuhrt werden, z.B. mit Hilfe von Computer-Alignments, 
Southern Blots, PCR und dgl. und anschliefSender Zuordnung der 
Sequenzen. Aufgrund von Homologien kann dann auf potentielle 
Bindepartner der Proteine geschlossen werden. 

Ebenfalls bevorzugt konnen auch kombinatorische Bindungsstudien uber 
Target-gerichtetes-Screening-Verfahren mit Hilfe von Substanzen- 
Bibliotheken durchgefuhrt werden. Die potentiellen bindenden Substanzen 
werden in einer speziellen Anordnung gebunden vorgelegt, z.B. in 
Mikrotiterplatten oder anderen Tragermaterialien. AnschlieSend wird das 
"Target", in der Regel aufgereinigte, gegebenenfalls rekombinante 
Heficobacter-Prote\ne, in loslicher Form hinzugegeben, was den Nachweis 
einer Wechselwirkung zwischen dem Target und bestimmten Substanzen 
ermoglicht. Ein indirekter Nachweis kann durch markierte Antikorper, die 
gegen die Substanz gerichtet sind, oder durch Einfuhren zusatzlicher 
Elemente ("Tags") in das Target erbracht werden. 

Eine weitere Variante der Bindungsstudien besteht in der Expression von 
He/icobacter-Prote\nen in rekombinanten Bakterien (z.B. solche, die das 
fluoreszierende Protein GFP oder bestimmte Enzyme herstellen), welche die 
Proteine auf der Oberflache prasentieren, und anschlie&endes Testen einer 
Substanzen-Bibliothek. 
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Weiterhin kann die dreidimensionale Struktur der von den 
erfindungsgema&en identifizierten Genen kodierten Polypeptide oder deren 
Fragmente auch durch kristallographische Analyse ermittelt werden. Bei 
ausreichender Auflosung konnen eventuelle "Taschen" oder sonstige 
Bindestellen in ihrer dreidimensionalen Struktur exakt charakterisiert werden. 
Aufgrund dieser Daten kann die Struktur potentieller Bindepartner berechnet 
werden. 

Mit Verfahren, wie etwa "Two-hybrid System", Display-Systemen, "High 
Throughput Screening" oder kombinatorischen Bindungsstudien konnen 
zufallig generierte Polypeptide identifiziert werden, die an die Helicobacter 
Polypeptide der Erfindung oder deren Fragmente, oder an weitere 
erfindungsgemaSidentifizierte Polypeptide binden. Wird auf diese Weise ein 
entsprechendes Peptid gefunden, kann dieses chemisch weiter modifiziert 
werden, bis die optimale mogliche Bindung erreicht ist. Das identifizierte 
Polypeptid kann z.B. als Inhibitor verwendet werden, indem es z.B. an ein 
Toxin und ein Internalisierungssignal gekoppelt wird, das den pathogenen 
Keim zerstort oder aber als Peptidmimetikum, um das Binden des Keims an 
die zellulare Oberflache zu verhindern (EP-41 2,762A und EP-B31 ,080A). Mit 
Hilfe des "Two Hybrid Systems" konnen aber auch Aktivatoren des 
Immunsystems generiert werden. Die identifizierten Peptide, die an die 
Helicobacter Polypeptide der Erfindung binden, konnen hierzuan bestimmte 
Liganden z.B. fur den T-Zell-Rezeptor gekoppelt werden. Werden also einem 
von Pathogenen befallenen Tier oder Menschen diese so ausgestatteten 
Peptide verabreicht, wird das korpereigene Immunsystem spezifisch 
angelockt und aktiviert. 

Die Einhaltung der einzelnen Schritte ist hierbei nicht zwingend, sondern 
kann durch weitere Schritte erganzt bzw. ersetzt werden. 

Die jeweiligen Prototypen eines immunologischen bzw. pharmakologischen 
Wirkstoffs werden nachfolgend weiterentwickelt und verbessert. 
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Die Weiterentwicklung eines Impfstoffes kann dahingehend erfolgen, indem 
mehrere antigene Genprodukte oder Teile davon in einem Wirkstoff 
kombiniert werden und/oder mit verschiedenen Tragern bzw. Zusatzstoffen 
verabreicht werden . Als Trager fungieren verschieden attenuierte bakterielle 
oder virale Organismen und als Zusatzstoffe Adjuvantien und/oder Cytokine. 

Zur Weiterentwicklung eines pharmakologischen Wirkstoffs wird eine als 
wirksam charakterisierte Leadstruktur chemisch weiter modifiziert, so daS 
eine optimale Bindung und Inhibierung des identifizierten Genprodukts 
erfolgt. Weiterhin sollte der Wirkstoff vom Patienten gut vertragen werden 
und geringe Nebenwirkungen besitzen. 

Zur Identifizierung von Wirkstoffen, die an Polynukleotide binden, kann ein 
Polynukleotid der Erfindung z.B. an eine Tragermatrix vorgekoppelt werden 
bzw. umgekehrt, die Wirkstoffe der Polypeptide- bzw. kombinatorischen 
Substanzenbank. Das verwendete darauffolgende Schema ist das gleiche 
wie das, das fur die Polypeptide schon beschrieben wurde. 

Solche inhibitorischen Substanzen konnen Polypeptide, Peptide, aber auch 
chemische Substanzen sein, wie etwa Antibiotika. Die inhibitorische 
Wirkung kann dabei in verschieden Stadien der Replikation der zu 
bekampfenden Mikroorganismen eingreifen. Beispiele sind 
Expressionsinhibitoren oder Enzyminhibitoren oder sonstige Inhibitoren, 
welche die naturliche Funktion der Polypeptide von Helicobacter und 
verwandten Mikroorganismen beeinflussen konnen. Solche inhibitorischen 
Substanzen sind ebenfalls Gegenstand der Erfindung. 

Eine weitere Moglichkeit, einen optimalen Wirkstoff gegen Helicobacter und 
andere bakterielle Infektionen zu finden, ist mit Hilfe von speziellen 
Computerprogrammen. Aufgrund von kristallographischen Daten, die von 
den in der Erfindung beschriebenen Polypeptiden gewonnen wurden kann 
ein Modell erstellt werden, das sterische, elektronische, hydrophobe und 
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sogenannten "resultierende Bindungsmomente" (RBMs) miteinander 
verbindet (Ray et al., 1998). Anhand dieses Modells konnen im weiteren 
Substanzen am Computer modelliert werden, die zwar die bereits 
identifizierten Leadstrukturen enthalten konnen, aber mit besseren 
Bindungseigenschaften ausgestattet sind. Es konnen jedoch auch vollig 
neuartige Wirkstoffe entworfen werden. 

Ein weiterer Aspekt der vorliegenden Erfindung ist eine Nukleinsaure, die fur 
ein essentielles sekretorisches Gen aus Helicobacter pylori kodiert, das 
durch das oben beschriebene erfindungsgema&e Verfahren identifiziert 
wurde. Es wurden essentielle He/icobactergene mit dem vorliegenden 
Verfahren identifiziert, deren Nukleinsauresequenzen in den SEQ ID NO. 1 
bis 113 (ungerade Zahlen) angegeben sind. Eine erfindungsgemafce 
Nukleinsaure ist beispielsweise dadurch gekennzeichnet, daft sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl von 1 
bis 1 13 einschlieSlich ist, dargestellten Nukleinsauresequenzen oder 
einen proteinkodierenden Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration des 
genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter stringenten 
Bedingungen hybridisierende Nukleotidsequenz umfaBt. 

Neben den im Sequenzprotokoll gezeigten erfindungsgemaSen 
Nukleotidsequenzen und diesen Sequenzen im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenzen umfafct die 
vorliegende Erfindung auch Nukleotidsequenzen, die mit einer der zuvor 
genannten Sequenzen hybridisieren. Der Begriff "Hybridisierung" gemafc 
vorliegender Erfindung wird bei Sambrook et al. (Molecular Cloning, A 
Laboratory Manual, Cold Spring Harbor Laboratory Press (1989), 1.101- 
1.104) verwendet. Vorzugsweise spricht man von einer stringenten 
Hybridisierung, wenn nach dem Waschen fur eine Stunde mit 1 X SSC und 
0,1% SDS bei 50°C, vorzugsweise bie 55°C, besonders bevorzugt bei 
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62°C und am meisten bevorzugt bei 68°C, insbesondere fur 1 h in 0,2 X 
SSC und 0,1 % SDS bei 55°C, vorzugsweise bei 55°C, besonders 
bevorzugt bei 62 °C und am meisten bevorzugt bei 68 °C noch ein positives 
Hybridisierungssignal beobachtet wird. Eine unter derartigen 
Waschbedingungen mit einer oder mehreren der erfindungsgemafcen 
Nukleotidsequenzen oder einer diesen Sequenzen im Rahmen der 
Degeneration des genetischen Codes entsprechenden Nukleotidsequenz 
hybridisierende Nukleotidsequenz ist eine erfindungsgemafce Nukleotidse- 
quenz. 

Vorzugsweise ist die erfindungsgemafce Nukleotidsequenz eine DNA. Sie 
kann jedoch auch eine RNA oder ein Nukleinsaureanalogon, wie etwa eine 
peptidische Nukleinsaure, umfassen. Besonders bevorzugt umfaGt die 
erf indungsgemaBe Nukleinsaure einen Protein-kodierenden Abschnitt der in 
Sequenzprotokoll dargestellten Nukleotidsequenzen oder eine Sequenz, die 
eine Homologie von mehr als 80 %, vorzugsweise mehr als 90 % und 
besonders bevorzugt mehr als 95 % zu den dargestellten Nukleotidse- 
quenzen oder einen vorzugsweise mindestens 20 Nukleotide (nt) und 
besonders bevorzugt mindestens 50 nt langen Abschnitt davon aufweist. 

Die Homologie wird in Prozent identischer Positionen beim Vergleich zweier 
Nukleinsauren (bzw. Peptidketten) angegeben, wobei 100% Homologie die 
vollige Identitat der verglichenen Kettenmolekule bedeutet (Herder: Lexikon 
der Biochemie und Molekularbiologie, Spektrum Akademischer Verlag 
1995). 

Eine erf indungsgemafce Nukleinsaure kann fur ein sekretiertes Polypeptid mit 
Signalpeptid kodieren oder fur ein sekretiertes Polypeptid ohne Signalpeptid. 

Eine erfindungsgemaBe Nukleinsaure umfafct sowohl die Sequenz des 
kodierenden Strangs als auch die dazu komplementare Sequenz. Letztere 
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kann beispielsweise bei der Herstellung von Antisense-Nukleinsauren 
Anwendung finden. 

Ebenfalls Gegenstand der Erfindung ist naturlich auch eine Genbank, die 
mindestens 2, bevorzugt mindestens 20, starker bevorzugt mindestens 1 00 
der genannten Nukleinsauren in Vektoren kloniert enthalt. 

Eine Auflistung der hierin und im Sequenzprotokoll angegebenen 
erfindungsgemafcen Nukleinsauren samt ihrer Genprodukte und deren 
Funktionen und putativen Funktionen ist in den Tabellen I und II angegeben. 



- 49 - 

Tabelle I: Obligat ssentiell G ne 



SEQ ID 
NO 


Gen 
{obligat 
essentiell) 


Lange 


lv)r)nIir*Ho Pinancphaftan rlar 
m uyiiwile Cig ciioUnaTlcn Ucr 

Genprodukte 


oignai- 
peptid 


1+2 


HPS001 
(HPS1 66) 


873bp 


Signalpeptidase I 


+ 


3 + 4 


HPC003 


267bp 


Protein der Flagellenbiosynthese 


- 


5 + 6 




7 1 dhn 


Lipoprotein 




7 + 8 


HPC029 


552bp 


Sekretiertes Protein 




9+ 10 


HPS042 


858bp 


Inneres Membranprotein, Ubiquinol- 
vjxiaoreauKtase 


- 


11 + 12 


HPC1 38) 

III ■ \J w? f 


1 Q9hn 


oeKretienes rroxem 


+ 


13+14 


HPS062 
(HPS171) 


957bp 


SpkrpfiprtPQ Prntpin 




15+16 


HPS065 
(HPS153) 


1 629bp 


LiDODrotein 

^1 1 V w III 


1^ 


17 + 18 


HPS066 


1377bp 


Inneres MembranDrotein Fi<>pn- 
Schwefel-Bindungsprotein 




19 + 20 


HPS068 


1 533bp 


Lipase 


_|_ 

I 


21+22 


HPS074 


957bp 


Sekretiertes Protein 




23 + 24 


HPS083 


480bp 


Sekretiertes / DeriDlasmatischp^ Prntpin 




25 + 26 


HPS084 


1983bp 


Sekretiertes / periplasmatisches Protein 


+ 


27 + 28 


HPC085 


372bp 


SekretiertSS / nprinlaQmfltiQnhpc Prn-fpin 


1 
1 


29 + 30 


HPC090 


558bp 


Sekretiertes / nerinla^rnaticiohPQ Prntpin 


_1_ 


31+32 


HPS 104 


768bp 


nteorales Membrannrntpin 

■ ■ > W J»| 1 W 1 WW ITI w 1 1 lUI wl 1 1 fa/ 1 \J L w III 




33 + 34 


HPS1 1 5 


2367bp 


ATPase fur Katinnpntrancnnrt 

• » www iui ixaiiui ici in al loUUI L 




35 + 36 


HPS120 


2751bp 


Au&eres MemhrannrntPin nrntpl^ti\/oc 

*^w:i%jwi i vi wl I I k/ 1 a 1 1 full *J LCI 1 1 1 UI ULCIxll VCO 

Oberflachenantigen 


_1_ 


37 + 38 


HPS130 


990bp 


Sekretiertes Protpin 


i 
i 


39 + 40 


HPS133 


1482bp 


Vlureinvorlauf er-Protein 




41 +42 


HPC134 


600bp 


Inneres MembranDrotein Prntpin- 

■ > • ■ ■ w ■ w ■ v ■ w 1 1 1 W 1 Wi | | | I w 1 1 If I I \J \, c III 

""ranslokationsprotein 




43 + 44 


HPS 143 


1536bp 


Sekretiertes / periplasmatisches Protein 


+ 


45 + 46 


HPS144 


540bp 


Peptidoglykan-assoziiertes Lipoprotein 


+ 


49 + 50 


HPS152 


1062bp 


Sekretiertes / periplasmatisches Protein 


+ 


51 + 52 


HPS155 


2202bp 


Protein der Flagellenbiosynthese 




53 + 54 


HPC157 
(HPC181) 


189bp 


Sekretiertes Protein 




55 + 56 


HPS183 


1008bp 


Eisen(lll) ABC-Transporter 


+ 


57 + 58 


HPS186 


240bp 


Sekretiertes Protein 




59 + 60 


HPS188 


1764bp 


AuSeres Membranprotein 


+ 


61+62 


HPS 190 


1443bp 


Sekretiertes / periplasmatisches Protein 
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Tabelle II: Fakultativ essentielle Gene 



SEQ ID 
NO 


Gen 
(fakultativ 
essentiell) 


Lange 


Mogliche Eigenschaften der 
Genprodukte 


Signal 
peptid 


99+100 


HPS004 

(HPS027, 
HPS! 21 , 


1 644bp 


Inneres Membranprotein 


+ 


63 + 64 


HPC008 

(HPC1 1 4, 
HrL 1 4b) 


543bp 


Sekretiertes / periplasmatisches Protein 


- 


65 + 66 


HPS01 3 


1 "7 /I CU n 

1 74bbp 


z. , o -zyKiiscne iNUKieotia-z - 
r nospnoaiesierase 


+ 


6 / + DO 


HPS024 
(MroU/D) 


1 09oDp 


wnemoTaxis-rroiein 


i. 


Di7 + /U 


n roUoD 


oooup 




F 


71 i 70 

/ 1 T / 


n roUoo 


OOv7Up 


Col/* rotiortoc Pm+oirn 




/ o -r / *+ 


n rouja 
inroi'T/| 




Col/ ro+i c» r+oc PrntPin 
oci\i clici ico n uicn i 




75 -1- 76 


1 1 1 OU'TV 


1 545bn 


Sekretiertes Protein 

\mJ \^ IX I w I 1 w 1 k<w w I 1 w b w III 


+ 


77 -+- 78 


n i ou*tu 


91 2bp 


Sekretiertes Protein 


+ 


79 + 80 


HPS050 


834bp 


Periplasmatisches Glutamin-Bindeprotein 


+ 


81+82 


HPS052 


1296bp 


AuSeres Membranprotein 




OO "t~ o*f 


n roUO D 


1 1 Q7hn 
i i <j / up 


Cpl/ r^t" i ^ rt^c Pr/^+oin 

OCM CLIC7I LCO ilU LCI 1 1 




Ow i OD 


n rouo3 


i i o i up 


iMLcyidiCo ivici i iui at i pi u lci 1 1 


+ 


87 + 88 


HPS063 


516bp 


ATP Synthase F0, Untereinheit b 


+ 


89 + 90 


HPS069 


990bp 


Sekretiertes Protein 


+ 


91 + 92 




Do4Dp 


mxegraies iviemDranprotem 




93 + 94 


HPS095 


729bp 


AuSeres Membranprotein 


+ 


95 + 96 


HPS099 


9 /bup 


Sekretiertes Protein 




97 + 98 


HPS1 1 7 

/ |_J no 1 1 Q 
U DC 1CO\ 


1 290bp 


Sekretiertes Protein 


1 

+ 


ini i 1 no 

IV I T I UZ. 


M DC lOO 

nro 1 oZ 


oUDOOp 


r\a LIUI lei lc 1 I IUa rTUlclfl 


r 


4.7 -t- 


uppl AO 

(HPC150, 
HPC179) 


1 557bn 


AlnA AHhM^in 

f\ 1 \ / » \J 1 luoll 1 


-J- 


103 + 104 


HPS149 


2028bp 


Methylakzeptierendes 
Chemotaxisprotein 




105+106 


HPS161 


273bp 


Sekretiertes Protein 


+ 


107 + 108 


HPS176 


759bp 


Protein der cag Pathogenitatsinsel 




109 + 110 


HPS187 


1245bp 


Zinkabhangige Metalloprotease 


+ 


111 + 112 


HPS189 


1566bp 


Sekretiertes Protein 




113+114 


HPS191 


1782bp 


Sekretiertes Protein 


+ 
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Ein weiterer Aspekt der vorliegenden Erfindung ist ein Vektor, der eine 
erfindungsgemafSe Nukleinsaure oder einen Abschnitt davon enthalt. Die 
Nukleinsaure oder der Nukleinsaureabschnitt kann so in den Vektor kloniert 
sein, dafc sie entweder in Sense- oder Antisense Richtung exprimiert werden 
kann. Der Nukleinsaureabschnitt hat bevorzugt eine Mindestlange von 15 
Nukleotiden, starker bevorzugt 20 Nukleotiden, starker bevorzugt 50 
Nukleotiden. Dieser Vektor kann ein beliebiger prokaryontischer oder 
eukaryontischer Vektor sein, auf dem sich die erfindungsgemafce DNA- 
Sequenz vorzugsweise in Verbindung mit Expressionssignalen bef indet, wie 
z.B. Promoter, Operator, Enhancer etc. Beispiele fur prokaryontische 
Vektoren sind chromosomale Vektoren, wie etwa Bakteriophagen (z.B. 
Bakteriophage A) und extrachromosomale Vektoren wie etwa Plasmide, 
wobei zirkulare Vektoren besonders bevorzugt sind. Geeignete 
prokaryontische Vektoren sind z.B. bei Sambrook etal., Molecular Cloning 
(1987), Kapitel 1-4, beschrieben. Andererseits kann der erfindungsgemaBe 
Vektor auch ein eukaryontischer Vektor sein, z.B. ein Hefevektor oder ein 
fur hohere Zellen geeigneter Vektor (z.B. ein Plasmidvektor, viraler Vektor, 
Pflanzen vektor). Derartige Vektoren sind beispielsweise bei Sambrook etal., 
supra, Kapitel 16 beschrieben. CAI- und SRM-Vektoren, wie oben 
beschrieben, sind ebenfalls Gegenstand der Erfindung. 

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Zelle, die mit 
einem erfindungsgemafSen Vektor oder einer erfindungsgemaSen 
Nukleinsaure transformiert ist. In einer bevorzugten Ausfuhrungsform ist 
diese Zelle eine prokaryontische Zelle, vorzugsweise ein gram-negatives 
Bakterium, z.B. E.colL Andererseits kann die erfindungsgemaSe Zelle jedoch 
auch eine eukaryontische Zelle sein, wie etwa eine Pilzzelle, eine Hefezelle, 
eine tierische oder eine pflanzliche Zelle. Besonders bevorzugt handelt es 
sich bei der Zelle urn einen Mikroorganismus, z.B. Helicobacter oder 
Salmonellen. Mit CAI- oder SRM-Vektoren transformierte Mikroorganismen 
sind oben bereits beschrieben worden. Diese sind, wie auch mit den obigen 
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Verfahren herstellbare Mutantenbanken, ebenfalls Gegenstand der 
Erfindung. 

Ein weiterer Aspekt der Erfindung betrifft ein essentielles und bevorzugt 
sekretiertes Polypeptid von H. pylori. Insbesondere ist dies ein Polypeptid, 
das 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl von 2 bis 
1 14 einschlie&lich ist, dargestellten Aminosauresequenzen oder 

(b) eine mit einer der Sequenzen gemafS (a) immunologisch 
kreuzreagierende Sequenz umfafct. 

Unter immunologische kreuzreagierenden Sequenzen sind somit auch 
Muteine, Varianten und Fragmente der in den SEQ ID NO. 2 bis 114 
dargestellten Sequenzen umfaBt. Darunter sind Sequenzen zu verstehen, die 
sich durch Substitution, Deletion und/oder Insertion einzelner Aminosauren 
oder kurzer Aminosaureabschnitte von den obigen Sequenzen 
unterscheiden. 

Aufgrund von Homologieanalysen mit Hilfe des FASTA Proteinprogramms 
konnten den identifizierten Polypeptiden, deren Sequenz mit der 
Nukleinsauresequenz gefunden werden konnte, bestimmte Merkmale bzw. 
eine mutma&liche Lokalisation im Bakterium zugewiesen werden. Einige der 
von den erfindungsgemaSen Nukleinsauren kodierten Polypeptide besitzen 
ein Signalpeptid und werden durch den Sec-abhangigen Transport- 
mechanismus an ihre Zielstelle exportiert, wahrend andere kein Signalpeptid 
besitzen und daher wahrscheinlich uber einen Sec-unabhangigen 
Transportmechanismus, z.B. durch das ABC-Transporter-System, sekretiert 
werden (siehe Tabellen I und II). 

Ein weiterer Gegenstand der Erfindung ist ein Verfahren zur Herstellung der 
erfindungsgemaBen Polypeptide und -fragmente. Die Herstellung von 
erfindungsgemaRen Polypeptiden erfolgt vorzugsweise dadurch, dafc man 
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eine Zelle mit einem erfindungsgemafcen DNA-Molekul oder Vektor 
transformiert, die transformierte Zelle unter Bedingungen kultiviert, bei 
denen eine Expression des Polypeptids stattfindet, und das Polypeptid aus 
der Zelle oder/und aus dem Kulturuberstand isoliert. Dabei kann das 
erfindungsgemaSe Polypeptid sowohl als Fusionspolypeptid als auch als 
Nichtfusionspolypeptid gewonnen werden. 

Das erfindungsgemaBe Polypeptid kann als Immunogen zur Herstellung von 
Antikorpern verwendet werden. 

Die vorliegende Erfindung betrifft somit auch einen Antikorper, der gegen 
ein erfindungsgemafces Polypeptid gerichtet ist. Ebenfalls Gegenstand der 
Erfindung sind Fragmente solcher Antikorper, wie z.B. Fab-Fragmente oder 
Fc-Fragmente. 

Noch ein weiterer Aspekt der Erfindung ist ein Inhibitor der 
erfindungsgemafcen Polypeptide, deren Fragmente, bzw. deren Expression, 
Presentation oder/und naturlichen Funktion. Dies ist bevorzugt ein Molekul, 
welches in der Lage ist, spezifisch an ein Polypeptid oder Fragment davon 
zu binden oder/und dessen Expression, Presentation oder/und natiirliche 
Funktion zu beeinflussen. Die Identifizierung von solchen spezifischen 
Bindepartnern wurde oben bereits beschrieben. Besonders geeignet als 
Inhibitoren sind Proteine oder Peptide, die ein erf indungsgema&es Polypeptid 
in seinen naturlichen Funktion hemmen, z.B. konnen Enzyme durch 
Blockieren des aktiven Zentrums gehemmt werden. 

Noch ein weiterer Aspekt der vorliegenden Erfindung betrifft eine 
pharmazeutische Zusammensetzung, die als Wirkstoff ein 
erfindungsgema&es DNA-Molekul, einen erfindungsgema&en Vektor, eine 
erfindungsgemaSe Zelle, ein erfindungsgema&es Polypeptid, einen 
erfindungsgemaBen Antikorper oder Fragment davon oder/und ein 
inhibitorisches Molekul, das in der Lage ist, spezifisch an ein 
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erf indungsgemafces Polypeptid zu binden, gegebenenfalls zusammen mit ub- 
lichen pharmazeutischen Hilfs-, Verdiinnungs-, Zusatz- und Tragermitteln 
enthalt. 

Eine erfindungsgema&e pharmazeutische Zusammensetzung kann auf ver- 
schiedene Art und Weise und unter Verwendung einzelner ihrer Bestandteile 
als wirksame Substanzen zur Hemmung der Reproduktion von Helicobacter 
Organismen in einem Wirt, speziell im Menschen verwendet werden. 

Die erfindungsgemalSe pharmazeutische Zusammensetzung kann einerseits 
zur Diagnostik einer Helicobacter- 1 nfektion verwendet werden. Die 
Diagnostik auf Nukleinsaureebene erfolgt vorzugsweise durch Verwendung 
von Hybridisierungssonden, bzw. Primern, welche eine spezifische DNA- 
Sequenz aufweisen, die zu mindestens einen Abschnitt einer der in SEQ ID 
NO. 1 bis 1 1 3 (ungerade Zahlen) dargestellten Sequenzen komplementar ist, 
so daB sie eine Amplifikation der erfindungsgemafcen Sequenzen erlauben. 
Wir bereits erwahnt, konnen diese Amplifikationsprimer oder Sonden auch 
zur Amplifikation und damit zur Detektion von verwandten Mikroorganismen 
verwendet werden, wenn diese Gensequenzen aufweisen, die fur dasselbe 
essentielle Gen kodieren. Auf Proteinebene erfolgt die Diagnostik 
vorzugsweise mit Hilfe der erfindungsgemaSen Antikorper. 

Des weiteren ist die pharmazeutische Zusammensetzung zur Prophylaxe und 
Bekampfung von Helicobacter- 1 nfektion en und Infektionen mit verwandten 
Mikroorganismen geeignet. 

Ein weiterer wichtiger Aspekt der vorliegenden Erfindung ist die 
Verwendung der identifizierten essentiellen Gene von Helicobacter pylori 'zur 
Prevention oder Bekampfung einer Infektion mit Helicobacter oder 
verwandten Mikroorganismen. Insbesondere konnen diese identifizierten 
essentiellen Gene zur Herstellung von Impfstoffen (Vakzinen) verwendet 
werden (siehe oben). 
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Eine weitere Verwendung der Polypeptide der Erfindung besteht in der 
Aufreinigung der Antikdrper gegen H. pylori Polypeptide und gegen 
entsprechende Polypeptide aus verwandten und anderen Mikroorganismen. 

Die Erfindung wird durch die nachfolgenden Beispiele, Abbildungen und das 
Sequenzprotokoll naher erlautert. Im Sequenzprotokoll sind die folgenden 
Nukleinsaure- und Aminosauresequenzen dargestellt. 

Abbildung 1 zeigt eine schematische Darstellung eines CAI-Vektors. 

Abbildung 2 zeigt eine schematische Darstellung eines Verfahrens der 
konditionalen Antisense-Hemmung (CAI). 

Abbildung 3 zeigt eine schematische Darstellung der Untersuchung der 
Lebendfahigkeitvondefizienten Mikroorganismen anhand ihrer 
Uberlebensraten mit Hilfe des CIA-Verfahrens. 

Abbildung 4 zeigt eine schematische Darstellung des subtraktiven CAI- 
Verfahrens (CAI). 

Abbildung 5 zeigt eine schematische Darstellung eines SRM-Vektors. 

Abbildung 6 zeigt eine schematische Darstellung der reversiblen 
Inaktivierung eines Gens durch die Insertion/Excision eines 
konditional replizierenden SRM-Plasmids. 

Abbildung 7 zeigt eine schematische Darstellung eines SRM-Verfahrens. 



Abbildung 8 zeigt eine schematische Darstellung der Anreicherung von 
Fragmenten essentieller Gene durch subtraktive Hybridisierung. 
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Beispiele 

Die Anwendung des dargestellten Gesamtverfahrens ist exemplarisch am 
Beispiel des Pathogens Helicobacter dargestellt, la(St jedoch auch mit 
anderen pathogenen Keimen durchfuhren. 

1 . Identifizierung essentieller Gene pathogener Mikroorganismen 

Schritt 1 

Anreicherung von H. pylori Genen kodierend fur sekretorische/exkretorische 
Polypeptide 

Herstellunq einer H. pylori Genbank im Minimalvektor pMin2: Als 
Ausgangsstamm dient der H. pylori Wildtyp Stamm 69A. Die Bakterien 
werden auf Serumplatten oder einem anderen adaquaten Medium 
(Westblom et al., 1991) bei einer Temperatur von 37°C in einer 
Atmosphare von 5% 0 2/ 1 0% C0 2 , 85% N 2 angeziichtet. Die Isolierung der 
chromosomalen DNA erfolgt nach der Methode von Leying et al., (1992), 
wobei die DNA anschlie&end uber einen Casium-Chlorid-Gradienten 
aufgereinigt wird. 50//g der gereinigten, chromosomalen DNA wird mit den 
Restriktionsendonukleasen Sau3A und HpaW partiell gespalten, die DNA 
Fragmente in einem Agarosegel aufgetrennt und die Fragmente in einer 
GroISe von 3 bis 6 kbp aus dem Gel mit Hilfe des Geneclean II Kits (Bio101) 
eluiert. Die isolierten DNA-Fragmente werden in den BglW und C/al 
geschnittenen pMin2-Vektor (Kahrs et al., 1995) kloniert und uber 
Elektroporation in den £,co//-Stamm E181 transformiert, dem zuvor das 
Plasmid pTnMax9 ubertragen wurde. Insgesamt werden uber einen solchen 
Ansatz ca. 4000 Klone generiert. Der f.co//-Stamm E1 81 ist ein Derivat des 
Stammes HB101 (Boyer und Roulland-Dussoix, 1969) und enthalt den 
lysogenen-Phagen CH616 zur Replikation des pTnMax9-Plasmids. 
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Serumplattenrezeotur: 

36 g GC-Agar (Basis) in 910 ml Aqua dest. suspendieren und autoklavieren 
auf ca. 45°C abkuhlen lassen 
Zugabe von 10 ml Vitaminmix 

Zugabe von jeweils 1 ml der Antibiotikastammlosung: 

Vancomycin (10 mg/l in Aqua bidest) 

Nystatin (0,793 mg/l in DMF*) 

Trimethoprim (5 mg/l in DMF*) 

Amphotericin (5 mg/l in DMF*) 
* DMF = Dimethylformamid 
Zugabe von 90 ml Serum oder 
Zugabe von 8% Pferdeblut = 80 ml 
oder gleiche Menge Humanblut 

Antibiotika Stammlosunq 

Vancomycin 100 mg in 10 ml Aqua bidest 

Nystatin 7,93 mg in 10 ml DMF (je 1 ml pro Liter GC-Agar 



zusetzen) 



Trimethoprim 
Amphotericin 
(Lagerung im 



50 mg in 10 ml DMF 
50 mg in 10 ml DMF 
Kuhlschrank bis max. 8 Wochen) 



Vitaminmix (Konzentrat) 



Dextrose (D-Glucose) 100 g 

L-Glutamin 10 g 

Cystein HCI (C 3 H 7 N0 2 S x HCI x H 2 0) 26 g 



Cocarboxylase 100 mg 



in 50 ml 



Fe (N0 3 ) 3 20 mg 

Thiamin HCI 3 mg 



Aquabidest. losen 



DPN NAD 



250 mg 
10 mg 

1.1 9 



Vitamin B 



12 



L-Cystein (C 6 H 12 N 2 0 4 S 2 ) 
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Adenin 



1,0 g in 15 ml HCI 

30 mg (32%ig) losen 



Guanin CI 



Uracil 



500 mg 
150 mg 
13 mg 



L-Arginin HCI 
p-Aminobenzoesaure 



(sterilfiltrieren, in 10 ml Portionen abfullen und einfrieren) 

Genetische Anreicherung sekretorischer/exkretorischer H. pylori 
Genprodukte: Das auf pTnMax9 liegende Transposon TnMaxB ist mit dem 
genetischen Marker ^-Lactamase ausgestattet. Dieser Marker ist auf dem 
Transposon so angelegt, da& damit die Selektion erfolgreicher Transposon- 
Insertionen ermoglicht wird, wenn dieses im korrekten Leserahmen solcher 
Gene vorliegt, deren Produkte von E.co//-Stamm E145 rif sekretiert bzw. 
exportiert werden. Die Insertion des Transposons in ein solches Gen fuhrt 
zu einer Genfusion zwischen dem Zielgen und dem Marker, wobei durch ein 
im Zielgen determiniertes Sekretions- und/oder Exportsignal das 
Fusionsprotein aus der Zelle geschleust wird und die Aktivitat des integralen 
Reportergens entfaltet wird. Im Fall der B-Lactamase konnen die Klone 
direkt uber die Entwicklung einer Resistenz gegen Ampicillin nachgewiesen 
werden. Das TuMaxQ Transposon auf pTnMax9 wird uber IPTG aktiviert. 

Die Transposon-Mutagenese der Genbank wird in Pools von bis zu 20 
Einzelklonen durchgefuhrt. Die jeweiligen Pools weren auf LB-Platten 
ausplattiert, die mit 100//M IPTG, 15/yg/ml Chloramphenicol und 15/yg/ml 
Tetrazyklin versetzt sind. In einem zweiten Schritt werden die TnMax9 
mutagenisierten pMin2-P!asmide uber Konjugation in den E.coli Stamm 
E145 nf Ciberfuhrt, da diese mit einem entsprechenden mob-Signal (oriT) 
ausgestattet sind. Die pTnMax9-PIasmide werden dagegen nicht ubertragen. 
Folglich kommt es in E.coli E145 rif zu einer spezifischen Vervielfaltigung der 
mutagenisierten pMin2 Genbank. Die entsprechenden Transkonjuganten 
werden auf LB-Medium mit 1 5 /yg/ml Chloramphenicol, 1 5 /;g/ml Tetrazyklin 
und 100 /yg/ml Rifampicin selektioniert. Insgesamt werden 500 bis 1000 
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Transkonjuganten in 2 ml LB-Meclium zusammengefafct und in 
entsprechenden Verdunnungen (10* 1 bis 10' 2 ) auf LB-Platten angezuchtet, 
die mit 50/yg/ml Ampicillin versetzt sind. Nach einer Kultivierung der Platten 
uber 36 Stunden bei 37 °C erhalt man im gesamten Ansatz 200 bis 300 
Ampicillin-resistente Klone mit Transposon inserierten Plasmiden. 

Schritt 2 

Herstellung Gen-defizienter H. pylori, die in sekretorische/exkretorische 
Polypeptide kodierende Gene mutiert sind und die Identifizierung solcher 
Gene mit essentieller biologischer Funktion. 

Herstellung Gen-de fizienter H. pylori Mutanten: Durch Einbringung der 
gewonnenen Plasmide mit den TnMax9-mutierten H. pylori Genen, kodierend 
fur sekretierte/exkretierte Polypeptide in einen H. pylori Wildtyp Stamm 
konnen Gen-spezifische Mutanten erzeugt werden. Bedingt durch die 
klonierten H. pylori Gensequenzen auf den Plasmiden kommt es im Falle 
eines doppelten homologen Rekombinationsereignisses zu der genomischen 
Insertion des TnMax9-Transposons in das chromosomale Zielgen und damit 
zu dessen Inaktivierung. Durch den genetischen Marker auf dem Transposon 
kann dieser Vorgang selektioniert werden, da das pMin2 Plasmid in H. pylori 
nicht repliziert wird. 

In der Durchfuhrung wird der H. pylori Wildtyp Stamm 69A in Einzelansatzen 
mit den gewonnenen individuellen Plasmiden transformiert, wobei die 
naturliche Kompetenzdes Bakteriums, DNA aufzunehmen, ausgenutzt wird. 
Entsprechend den Standard Kultivierungsbedingungen werden die Bakterien 
in BHI-Medium aufgenommen und bis zu einer optischen Dichte bei 550 nm 
von 0,1 bei 37°C unter mikoraerophilen Bedingungen angezuchtet. Die 
einzelnen Kulturansatze werden jeweils mit 200 bis 599 ng gereinigte 
Plasmid-DNA versetzt und die Kultur uber Nacht fortgesetzt. 
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Charakterisierung der biologischen Funktion der Gen-defizienten H. pylori 
Mutanten im Wachstumstest: Die einzelnen Ansatze werden nach der 
Kultivierung auf Serumplatten ausplattiert, welche mit 4 //g/ml 
Chloramphenicol versetztsind. HinsichtlichderWachsumseigenschaftender 
einzelnen Mutanten im Vergleich zum Wildtyp Stamm konnen 3 Kategorien 
unterschieden werden: (1) Mutanten, die nicht wachsen; (2) Mutanten, die 
kleinere Kolonien ausbilden; (3) Mutanten, die eine normale Koioniegrofce 
entwickeln. Diese Ergebnisse konnen fur jedes Ausgangsplasmid 
reproduzierbar erzielt werden. Zur eindeutigen Beurteilung der biologischen 
Bedeutung der Gen-defizienten Mutanten der Kategorie 1 werden diese dem 
CAI-Verfahren zugefuhrt. Die Gen-defizienten Mutanten der Kategorie 2 und 
3 werden in den anderen biologischen Testsystemen analysiert. 

Schritt 3 

Ermittlung der Identitat der H. pylori Gene kodierend fur 
sekretorische/exportierte Polypeptide. 

Zur Ermittlung der Primarstruktur der identifizierten H. pylori Gene, werden 
die jeweiligen Ausgangsplasmide aus dem E.coli Stamm verwendet. Die 
Plasmide werden aus diesen Stammen isoliert und die Nukleotidsequenz der 
Zielgene durch Sequenzierung der Bereiche oberhalb und unterhalb der 
Insertionsstelle des Transposons im Zielgen bestimmt. Das Leseraster des 
Zielgens kann direkt ermittelt werden, da das Transposon-kodierte B- 
Laktamase Gen eine aktive Fusion mit dem Genprodukt des Zielgens eingeht 
(s.o.). Die Sequenzierung wird mit Hilfe eines ABI-Sequenz-Automaten nach 
Angaben des Herstellers mit folgenden Sequenzprimern durchgef uhrt: M 1 3- 
F (GTAAAACGACGGCCAGT) und M1 3-RP1 (CAGG AAACAGCTATG ACC) . 
Zur weiteren Charakerisierung der Gene wird die Datenbank Genebank des 
GCG-Programms herangezogen, z.B. zur Identifizierung bekannter, 
homologer Gene anderer Mikroorganismen (FASTA), zur Identifizierung 
potentieller Signalpeptidbereiche (SPSCAN) oder zur Identifizierung von 
Lipoproteinen (MOTIFS). 
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Bei einem Teil der charakterisierten Klone konnte nicht die vollstandige 
Gensequenz ermittelt werden, da das klonierte DNA-Fragment nicht das 
gesamte Gen enthielt. Das verfugbare DNA-Fragment wird dazu eingesetzt, 
um aus der Original-Genbank ein DNA-Fragment mit vollstandigen Gen zu 
isolieren. Aus diesen Klonen konnen dann mit einem Gen-spezifischen 
Primer und einem Vektor-spezifischen Primer die fehlehden Gensequenzen 
amplifiziert und anschliefcend direkt sequenziert werden. 
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Anspruche 

Verfahren zur Bereitstellung von Mitteln zum Nachweis, zur 
Prevention oder/und zur Therapie von mikrobiellen Infektionen, 
dadurch gekennzeichnet, 
dafS es die Schritte umfaBt: 

(A) Identifizieren von essentiellen Genen und den entsprechenden 
Polypeptiden durch Herstellung gendef izienter 
Mikroorganismen durch konditionale Antisense-Hemmung 
(CAI) oder/und subtraktive Rekombinations-Mutagenese (SRM) 
und Bestimmung der Lebens- oder/und Oberlebensfahigkeit der 
gendefizienten Mikroorganismen in einern Testsystem. 

(B) Identifizieren von spezifischen Wirkstoffen, welche gegen die 
essentiellen Polypeptide gerichtet sind und die Inaktiviertung 
der Mikroorganismen oder verwendeter Mikroorganismen 
herbeifuhren. 

(C) Testen der identifizierten Wirkstoffe auf ihre Anwendbarkeit 
als Bestandteile von diagnostischen, praventiven oder/und 
therapeutischen Mitteln, 

(D) Formulieren der anwendbaren Wirkstoffe als diagnostische, 
preventive oder/und therapeutische Mittel. 

Verfahren nach Anspruch 1, 
dadurch gekennzeichnet, 

date obligat essentielle Gene durch CA! identifiziert werden. 

Verfahren nach Anspruch 1 , 
dadurch gekennzeichnet, 

dalS fakultativ essentielle Gene durch SRM identifiziert werden. 
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Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daft vor Schritt (A) eine Selektion auf Gene durchgefuhrt wird, die fur 
Polypeptide mit einer bestimmten Funktionalitat kodieren oder/und die 
fur Polypeptide kodieren, die in einer bestimmten Entwicklungsstufe 
exprimiert werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daS die Selektion mit Hilfe von Hybridisierungsverfahren durchgefuhrt 
wird, ausgewahlt aus Subtraktions- und Array-Verfahren. 

Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

dalS die Selektion auf spezifische subtrahierte apathogene oder 
pathogene Gene durchgefuhrt wird. 

Verfahren nach Anspruch 5, 
dadurch gekennzeichnet, 

date die Selektion auf spezifische subtrahierte Gene von H.pyfori oder 
H.heilmannii durchgefuhrt wird. 

Verfahren nach einem der Anspruche 4 bis 7, 
dadurch gekennzeichnet, 

daS fur exportierte Polypeptide kodierende Gensequenzen selektiert 
werden. 

Verfahren nach einem der Anspruche 4 bis 8, 
dadurch gekennzeichnet, 

daft fur sekretierte Polypeptide kodierende Gensequenzen selektiert 
werden. 
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Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gekennzeichnet, 

daS fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklung der vitalen Form aus der Oberdauerungsform notwendig 
sind. 

Verfahren nach einem der Anspruche 4 bis 9, 
dadurch gekennzeichnet, 

da& fur Polypeptide kodierende Gene selektiert werden, welche zur 
Entwicklung der Oberdauerungsform aus der vitalen Form notwendig 
sind. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

date in Schritt (A) zur Bestimmung der Lebens- und 
Uberlebensfahigkeit der gendefizienten Mikroorganismen 
Testsysteme, ausgewahltaus//?-i//Yro-Systemen, Zellkultursystemen, 
Gewebekultursystemen und Tiermodellen als naturliche Umgebung 
verwendet werden. 

Verfahren nach Anspruch 1 2, 
dadurch gekennzeichnet, 

dalS diejenigen defizienten Gensequenzen, welche zu nicht 
kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
gendefizienten Mikroorganismen fuhren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

Verfahren nach Anspruch 12, 
dadurch gekennzeichnet, 

date diejenigen defizienten Gensequenzen, welche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
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Mikroorganismen fuhren, der Kategorie der fakultativ essentiellen 
Gene zugeordnen werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daQ> die identifizierten Gene zur Herstellung von Primern verwendet 
werden, mit Hilfe derer entsprechende Gene aus verwandten 
Mikroorganismen, Subspezies oder/und Arten identifiziert werden. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

da& in Schritt (B) spezifische Wirkstoffe identifiziert werden, welche 
die Expression, Presentation oder/und Funktion der essentiellen 
Polypeptide beeinflussen, insbesondere immunologisch wirksame 
Substanzen, Bindepartner der Polypeptide oder deren Fragmente 
oder/und inhibitorische Substanzen. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daft Schritt (B) eine Bestimmung des immunogenen Potentials der 
Polypeptide oder/und deren Fragmente umfaBt, wobei die 
identifzierten Gene exprimiert werden und anschlieBend eine 
Western-Blot-Analyse durchgefuhrt wird oder/und date mit den 
identifzierten Polypeptiden oder Fragmenten davon eine Vakzinierung 
in Zellkultur oder im Tiermodell durchgefuhrt und die Auslosung einer 
spezifischen Immunreaktion beobachtet wird. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

da& Schritt (B) eine Bestimmung des Bindungspotentiais der 
Polypeptide oder deren Fragmente durch Screening von 
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Substanzenbibliotheken, Oberflachendisplay verfahren, kristallo- 
graphische Analyse oder/und Computer-Modelling umfaSt. 

Verfahren nach einem der vorhergehenden Anspruche, 
dadurch gekennzeichnet, 

daB die diagnostischen, praventiven oder/und therapeutischen Mittel 
in Form von passiven Impfstoffen oder aktiven Impfstoffen 
bereitgestellt werden. 

Verfahren nach Anspruch 1 9, 
dadurch gekennzeichnet, 

da& die passiven Impfstoffe in Form von Antikorpern oder/und 
Antikorperfragmenten und die aktiven Impfstoffe in Form von 
heterologen Tragersystemen oder/und in Form von Antigenen, 
Antigenfragmenten, Subunit-Vakzinen, Lebendvakzinen, DNA- 
Vakzinen oder/und Lebensmittelvakzinen bereitgestellt werden. 

Verfahren nach einem der vorhergehenden Anspruche 1 bis 19, 
dadurch gekennzeichnet, 

dalS die diagnostischen, praventiven oder/und therapeutischen Mittel 
inhibitorische Substanzen umfassen, insbesondere Expressionsinhibi- 
toren oder/und Enzyminhibitoren. 

Verfahren zur Identifizierung essentieller mikrobieller Gene, 
dadurch gekennzeichnet, 

da& es die Schritte umfaSt: 

(i) Herstellen von gendefizienten Mikroorganismen, 

(ii) Bestimmen der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen aus (i), 

(iii) Identifizieren eines proteinkodierenden Abschnitts einer 
mikrobiellen DNA-Sequenz, in der die gendefizienten 
Mikroorganismen defizient sind. 
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(iv) Charakterisieren derjenigen DNA-Abschnitte, die essentiell fur 
die Uberlebensfahigkeit sind. 

Verfahren nach Anspruch 22, 
dadurch gekennzeichnet, 

da(S die gendefizienten Mikroorganismen hergestellt werden, indem 
ein DNA-Abschnitt in einem mikrobiellen Genom mutagenisiert wird. 

Verfahren nach anspruch 22, 
dadurch gekennzeichnet, 

daSder DNA-Abschnitt durch Transposon-Mutagenese mutagenisiert 
wird. 

Verfahren nach Anspruch 23, 
dadurch gekennzeichnet, 

dalS die Mutagenisierung des DNA-Abschnitts auf dem mikrobiellen 
Genom durch homologe Rekombination erfolgt. 

Verfahren nach Anspruch 25, 

dadurch gekennzeichnet, 

dalS das SRM-Verfahren angewendet wird. 

Verfahren nach Anspruch 23, 
dadurch gekennzeichnet, 

dalS die gendefizienten Mikroorganismen hergestellt werden, indem 
in Mikroorganismen ein DNA-Abschnitt oder eine Teilsequenz davon 
in Form von Antisense-RNA exprimiert wird. 

Verfahren nach Anspruch 27, 

dadurch gekennzeichnet, 

da(S das CAI-Verfahren angewendet wird. 
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29. Verfahren nach einem der Anspruche 22 bis 28, 
dadurch gekennzeichnet, 

daB zur Bestimmung der Lebens- oder/und Uberlebensfahigkeit der 
gendefizienten Mikroorganismen Testsysteme ausgewahlt aus In- 
5 w'fro-Systemen, Zellkultursystemen, Gewebekultursystemen und 

Tiermodellen als naturliche Umgebung verwendet werden. 

30. Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

10 daB diejenigen defizienten Gensequenzen, welche zu nicht 

kultivierbaren und in naturlicher Umgebung nicht uberlebensfahigen 
gendefizienten Mikroorganismen fiihren, der Kategorie der obligat 
essentiellen Gene zugeordnet werden. 

is 31. Verfahren nach Anspruch 29, 
dadurch gekennzeichnet, 

daB diejenigen defizienten Gensequenzen, wefche zu kultivierbaren 
aber in naturlicher Umgebung nicht uberlebensfahigen defizienten 
Mikroorganismen fiihren, der Kategorie der fakultativ essentiellen 
20 Gene zugeordnet werden. 

32. Verfahren nach einem der Anspruche 22 bis 31, 
dadurch gekennzeichnet, 

daB das Identifizieren des proteinkodierenden DNA-Abschnitts durch 
25 Expression in einem Wirtsorganismus und Nachweis des 

Vorhandenseins eines Expressionsproduktes erfolgt. 

33. Verfahren nach einem der Anspruche 32 bis 32, 
dadurch gekennzeichnet, 

30 daB es weiterhin umfaBt: 

(v) Herstellen von Primern zur Amplifikation und Detektion von 
homologen Gensequenzen in heterologen Mikroorganismen 
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(vi) Identifizieren der homologen Gensequenzen. 

Nukleinsaure, kodierend fur ein essentielles sekretorisches Gen aus 
Helicobacter, identifiziert durch das Verfahren nach einem der 
Anspruche 22 bis 33. 

Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

daS sie fur ein sekretiertes Polypeptid mit Signalpeptid kodiert. 

Nukleinsaure nach Anspruch 34, 
dadurch gekennzeichnet, 

daB sie fiir ein sekretiertes Polypeptid ohne Signalpeptid kodiert. 

Nukleinsaure, 

dadurch gekennzeichnet, 

date sie 

(a) eine der in SEQ ID NO: n, wobei n eine ungerade ganze Zahl 
von 1 bis 113 einschliefclich darstellt, dargestellten 
Nukleinsauresequenzen, oder einen proteinkodierenden 
Abschnitt davon, 

(b) eine einer der Sequenzen aus (a) im Rahmen der Degeneration 
des genetischen Codes entsprechende Nukleotidsequenz oder 

(c) eine mit einer der Sequenzen aus (a) und/oder (b) unter 
stringenten Bedingungen hybridisierende Nukleotidsequenz 
umfa&t. 

Genbank, umfassend mindestens zwei Nukleinsauren nach einem der 
Anspruche 34 bis 37. 
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39. Vektor, 

dadurch gekennz ichnet, 

daS er mindestens eine Nukleinsaure nach einem der Anspruche 34 
bis 37 oder einen Abschnitt davon enthalt. 

40. Vektor nach Anspruch 39, 
dadurch gekennzeichnet, 
daS er ein CAI-Vektor ist. 



10 41 . Vektor nach Anspruch 39, 
dadurch gekennzeichnet, 
daS er ein SRM-Vektor ist. 



42. Zelle, 
is dadurch gekennzeichnet, 

da(S sie mit einer Nukleinsaure nach einem der Anspruche 34 bis 37 
oder einen Vektor nach einem der Anspruche 39 bis 41 transformiert 
ist. 



20 43. Mutantenbank, 

dadurch gekennzeichnet, 

daB sie aus mindestens zwei Mikroorganismen besteht, die mit einem 
Vektor nach Anspruch 40 oder einem Vektor nach Anspruch 41 
transformiert sind. 

25 

44. Polypeptid, 

dadurch gekennzeichnet, 

daS es von einer Nukleinsaure nach einem der Anspruche 34 bis 37 
kodiert ist. 



30 
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Polypeptid nach Anspruch 44, 
dadurch gekennzeichnet, 

da(2> es 

(a) eine der in SEQ ID NO: m, wobei m eine gerade ganze Zahl 
von 2 bis 114 einschlieSlich darstellt, dargestellten 
Aminosauresequenzen oder 

(b) eine mit einer der Sequenzen gemafc (a) immunologisch 
kreuzreagierende Sequenz umfafct. 

Polypeptid nach Anspruch 45, 
dadurch gekennzeichnet, 

daB es ein essentielles sekretiertes Polypeptid ist. 

Polypeptidfragment, 
dadurch gekennzeichnet, 

daR es einen immunogenen Abschnitt einer der Sequenzen nach 
Anspruch 45 aufweist. 

Inhibitorisches Molekul, erhaltlich durch das Verfahren nach 
Anspruch 1 , 

dadurch gekennzeichnet, 

dafc es in der Lage ist, spezifisch an ein Polypeptid oder Fragment 
davon nach einem der Anspruche 44 bis 47 zu binden oder/und 
dessen Expression, Presentation oder/und naturliche Funktion zu 
beeinflussen. 

Verfahren zur Herstellung eines Polypeptids oder Polypeptidfragments 
nach einem der Anspruche 44 bis 47, 
dadurch gekennzeichnet, 

da& man eine Zelle mit einer Nukleinsaure nach einem der Anspruche 
34 bis 37 oder einem Vektor nach Anspruch 39 transformiert, die 
transformierte Zelle unter Bedingungen kultiviert, bei denen eine 
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Expression des Polypeptids stattfindet und das Polypeptid aus der 
Zelle oder/und dem Kulturuberstand isoliert. 

Verwendung eines Polypeptids oder eines Fragmentes davon nach 
einem der Anspruche 44 bis 47 davon als Immunogen zur Erzeugung 
von Antikdrpern. 

Antikorper oder Fragment davon, 
dadurch gekennzeichnet, 

dafS er spezifisch ist fur ein Polypeptid oder ein Fragment davon nach 
einem der Anspruche 44 bis 47. 

Pharmazeutische Zusammensetzung, 
dadurch gekennzeichnet, 
daB sie als Wirkstoff 

a) eine Nukleinsaure nach einem der Anspruche 34 bis 37, 

b) einen Vektor nach Anspruch 39, 

c) eine Zelle nach Anspruch 42, 

d) ein Polypeptid oder ein Fragment davon nach einem der 
Anspruche 44 bis 47, 

e) einen Antikorper oder Fragment davon nach Anspruch 51 
und/oder 

f) ein inhibitorisches Molekul nach Anspruch 48, 
gegebenenfalls zusammen mit ublichen pharmazeutischen Hilfs-, 
Verdiinnungs-, Zusatz- und Tragermitteln, enthalt. 

Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Diagnostik, Prevention oder/und Therapie einer 
Helicobac ter- 1 n f e kt i o n . 

Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Hemmung der Reproduktion von Helicobacter- 
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Organismen und/oder anderen anthrogenen Mikroorganismen in 
einem Wirt. 

Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

daS eine Nukleinsaure nach einem der Anspruche 34 bis 37 als DNA- 
Vakzin formuliert wird. 

Verwendung nach Anspruch 54, 
dadurch gekennzeichnet, 

dalS ein Polypeptid oder Polypeptidfragment nach einem der 
Anspruche 44 bis 47 als Subunit-Vakzin oder als Lebendvakzin 
formuliert wird. 

Verwendung einer pharmazeutischen Zusammensetzung nach 
Anspruch 52 zur Herstellung eines Mittels fur die Diagnostik, 
Prevention oder/und Therapie einer He/icobacter-lnf ektion. 
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Zusammenfassung 



Die vorliegende Erfindung betrifft Verfahren zur Bereitstellung von 
therapeutischen, praventiven oder/und diagnostischen Mitteln gegen 
mikrobielle Infektion und zur Identifizierung und Charakterisierung 
essentieller Gene aus Helicobacter pylori. Weiterhin betrifft sie die 
identifizierten Nukleinsauren, welche fur die essentiellen Genprodukte 
kodieren, und die davon kodierten Polypeptide. 
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SEQUENZPROTOKOLL 

(1) ALLGEMEINE ANGABEN: 

(i) ANMELDER: 

(A) NAME: CREATOGEN Biosciences GmbH 

(B) STRASSE: Ulmer Strasse 160 a 

( C ) ORT : Augsburg 

(E) LAND: DE 

(F) POSTTjEITZAHL : 86156 

(A) NAME: Max-Planck-Gesellschaf t zur Foerderung der 

Wissenschaf ten e.V. 

(B) STRASSE: Hof gartenstrasse 2 

(C) ORT : Muenchen 

(E) LAND: DE 

(F) POSTLEITZAHL: 8 053 9 

(ii) BEZEICHNUNG DER ERFINDUNG: 
Helicobacter- Proteine zur I dent if izierung, 
Entwicklung und Optimirung von immunologischen und 
pharmakologischen Wirkstoffen 

(iii) ANZAHL DER SEQUENZEN: 114 

(iv) COMPUTER -LESBARE FASSUNG: 

(A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC compatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS -DOS 

(D) SOFTWARE: Patentln Release #1.0, Version #1.30 (EPA) 

(2) ANGABEN ZU SEQ ID NO: 1: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 873 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 

(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E): HPS001 (HPS166) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..873 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 1: 

ATG AAA TTT TTA CGC TCT GTT TAT GCA TTT TGC TCC AGT TGG GTA GGG 4 8 

Met Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
1 5 10 15 
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ACG ATT GTT ATT GTG CTG TTG GTT ATG TTT TTT ATC GCG CAA GCC TTT 96 
Thr lie Val lie Val Leu Leu Val lie Phe Phe lie Ala Gin Ala Phe 
20 25 30 

ATC ATT CCC TCT CGC TCT ATG GTT GGC ACG CTC TAT GAG GGC GAC ATG 144 
He He Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 4J 45 

CTC TTT GTC AAA AAG TTT TCT TAC GGC ATA CCC ATT CCT AAA ATC CCA 192 
Leu Phe Val Lys Lys Phe Ser Tyr Gly He Pro He Pro Lys. He Pro 
50 55 60 

TGG ATT GAG CTT CCT GTT ATG CCT GAT TTT AAA AAT AAC GGA CAT TTG 24 0 

Trp He Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

ATA GAG GGG GAT CGC CCT AAG CGT GGC GAA GTG GTG GTG TTT ATC CCT 28 8 

He Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe He Pro 
85 90 95 

C CAT GAA AAA AAG TCT TAC TAT GTT AAA AGG AAT TTT GCC ATT GGA 336 
o His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala He Gly 
100 105 110 

GGC GAT GAG GTG TTG TTC ACT AAT GAG GGT TTT TAT TTG CAC CCT TTT 3 84 

Gly Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

GAG AGC GAC ACG GAC AAA AAT TAC ATC GCT AAA CAT TAC CCT AAC GCC 432 
Glu Ser Asp Thr Asp Lys Asn Tyr He Ala Lys His Tyr Pro Asn Ala 
130 135 140 

ATG ACA AAA GAA TTT ATG GGT AAA ATT TTT GTT TTA AAC CCT TAT AAA 4 80 

Met Thr Lys Glu Phe Met Gly Lys He Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

AAT GAG CAT CCG GGT ATC CAT TAC CAA AAA GAC AAT GAA ACC TTC CAC 52 8 

Asn Glu His Pro Gly He His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

TTA ATG GAG CAA TTA GCC ACT CAA GGC GCA GAA GCT AAT ATC AGC ATG 576 
eu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn He Ser Met 
180 185 190 



CTC ATT CAA ATG GAG GGC GAA AAG GTG TTT TAT AAG AAA ATC AAT 624 
Gin Leu He Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 

GAC GAT GAA TTT TTC ATG ATC GGC GAC AAC AGA GAC AAT TCT AGC GAC 672 
Asp Asp Glu Phe Phe Met He Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 

TCG CGC TTT TGG GGG AGT GTG GCT TAT AAA AAC ATC GTG GGT TCG CCA 720 
Ser Arg Phe Trp Gly Ser Val Ala Tyr Lys Asn He Val Gly Ser Pro 
225 230 235 240 

TGG TTT GTT TAT TTC AGT TTG AGT TTA AAA AAT AGC CTA GAA ATG GAT 768 
Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys Asn Ser Leu Glu Met Asp 
245 250 255 



GCA GAA AAT AAC CCT AAA AAA CGC TAT CTG GTG CGT TGG GAA CGC ATG 816 
Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 
260 265 270 

TTT AAA AGC GTT GGA GGC TTA GAA AAA ATC ATT AAA AAA GAA AAC GCA 864 
Phe Lys Ser Val Gly Gly Leu Glu Lys He He Lys Lys Glu Asn Ala 
275 280 285 

ACG CAT TAA 
Thr His * 
290 




( 2 ) ANGABEN ZU SEQ ID NO : 2 : 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 291 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 2: 

Met Lys Phe Leu Arg Ser Val Tyr Ala Phe Cys Ser Ser Trp Val Gly 
1 5 10 15 

Thr He Val He Val Leu Leu Val He Phe Phe He Ala Gin Ala Phe 
20 25 30 

He He Pro Ser Arg Ser Met Val Gly Thr Leu Tyr Glu Gly Asp Met 
35 40 45 

Leu Phe Val Lys Lys Phe Ser Tyr Gly He Pro He Pro Lys He Pro 
50 55 60 

Trp He Glu Leu Pro Val Met Pro Asp Phe Lys Asn Asn Gly His Leu 
65 70 75 80 

He Glu Gly Asp Arg Pro Lys Arg Gly Glu Val Val Val Phe He Pro 
85 90 95 

Pro His Glu Lys Lys Ser Tyr Tyr Val Lys Arg Asn Phe Ala He Gly 
100 105 110 

y Asp Glu Val Leu Phe Thr Asn Glu Gly Phe Tyr Leu His Pro Phe 
115 120 125 

Glu Ser Asp Thr Asp Lys Asn Tyr He Ala Lys His Tyr Pro Asn Ala 
130 135 140 

Met Thr Lys Glu Phe Met Gly Lys He Phe Val Leu Asn Pro Tyr Lys 
145 150 155 160 

Asn Glu His Pro Gly He His Tyr Gin Lys Asp Asn Glu Thr Phe His 
165 170 175 

Leu Met Glu Gin Leu Ala Thr Gin Gly Ala Glu Ala Asn He Ser Met 
180 185 190 

Gin Leu He Gin Met Glu Gly Glu Lys Val Phe Tyr Lys Lys He Asn 
195 200 205 
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Asp Asp Glu Phe Phe Met lie Gly Asp Asn Arg Asp Asn Ser Ser Asp 
210 215 220 

Ser Arg Phe Trp Gly Ser Val Ala Tyr Lys Asn lie Val Gly Ser Pro 
225 230 235 240 

Trp Phe Val Tyr Phe Ser Leu Ser Leu Lys Asn Ser Leu Glu Met Asp 
245 250 255 

Ala Glu Asn Asn Pro Lys Lys Arg Tyr Leu Val Arg Trp Glu Arg Met 
260 265 270 

Phe Lys Ser Val Gly Gly Leu Glu Lys lie lie Lys Lys Glu Asn Ala 
275 280 285 

Thr His * 
290 

(2) ANGABEN ZU SEQ ID NO: 3: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 267 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT : 
(B) CLON(E) : HPC003 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..267 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 3: 

ATG GAA TCA CAA CTC ATG AAA CTC GCC ATT GAG ACT TAT AAA ATC ACT 4 8 

Met Glu Ser Gin Leu Met Lys Leu Ala lie Glu Thr Tyr Lys lie Thr 
295 300 305 

G ATG ATT TCT TTA CCG GTA TTA TTA GCG GGC TTA GTG GTG GGG CTA 96 
u Met lie Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
310 315 320 

TTA GTC AGT ATT TTT CAA GCG ACC ACT CAA ATC AAT GAA ATG ACC TTG 144 
Leu Val Ser lie Phe Gin Ala Thr Thr Gin lie Asn Glu Met Thr Leu 
325 330 335 

TCT TTT GTG CCT AAG ATT TTA GCC GTG ATT GGG GTG CTG ATT TTA ACC 192 
Ser Phe Val Pro Lys lie Leu Ala Val lie Gly Val Leu lie Leu Thr 
340 345 350 355 

ATG CCG TGG ATG ACT AAC ATG CTT TTA GAT TAC ACC AAA ACC TTA ATC 240 
Met Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu lie 
360 365 370 

AAG CTC ATT CCT AAA ATC ATA GGC TAG 2 67 

Lys Leu lie Pro Lys lie lie Gly * 
375 380 



(2) ANGABEN ZU SEQ ID NO: 4: 



(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 89 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 




(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Glu Ser Gin Leu Met Lys Leu Ala lie Glu Thr Tyr Lys lie Thr 
15 10 15 

Leu Met lie Ser Leu Pro Val Leu Leu Ala Gly Leu Val Val Gly Leu 
20 25 30 

Leu Val Ser lie Phe Gin Ala Thr Thr Gin He Asn Glu Met Thr Leu 
35 40 45 

Ser Phe Val Pro Lys He Leu Ala Val He Gly Val Leu He Leu Thr 
50 55 60 

et Pro Trp Met Thr Asn Met Leu Leu Asp Tyr Thr Lys Thr Leu He 
65 70 75 80 

Lys Leu He Pro Lys He He Gly * 

85 



(2) ANGABEN ZU SEQ ID NO: 5: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 714 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPC005 




( ix) MERKMAL : 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..714 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 5: 

TG CCT ATT AAC CCT CTC TAT CTT TTC CCT AAT CTT TTT ACC GCT AGC 
Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
90 95 100 105 

AGT ATT TTT TTA GGC ATG ATG AGT ATT TTT TAC GCT TCC AGT TAC CAA 
Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
110 115 120 

TTT GTC ATG GCG TGT TGG TTA GTG GTA GCG AGC CTT ATT TTA GAC GGG 
Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu He Leu Asp Gly 
125 130 135 

CTT GAT GGG CGT GTC GCA AGG CTT ACC AAC ACC ACC AGC AAG TTT GGT 
Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
140 145 150 
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ATA GAA TTT GAC TCA CTG GCT GAT GTA ATC GCT TTT GGG GTA GCC CCA 240 
lie Glu Phe Asp Ser Leu Ala Asp Val lie Ala Phe Gly Val Ala Pro 
155 160 165 

AGC TTA ATC ACT TAC TTT TAT GTG GGG TAT AAC TTT GGG CGC ATA GGC 2 88 

Ser Leu lie Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg lie Gly 
170 175 180 185 

ATG GCG GTG AGC GCG TTG TTT GTG ATT TTT GGA GCG ATA CGA TTG GCA 33 6 

Met Ala Val Ser Ala Leu Phe Val lie Phe Gly Ala lie Arg Leu Ala 
190 195 200 

CGA TTC AAT ATC AGC ACC AAC ACA AGC GAC CCC TAT TCT TTT ATC GGT 3 84 

Arg Phe Asn lie Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe lie Gly 
205 210 215 

ATC CCC ATT CCT GCG GCG GCG GTA TTG GTG GTG CTT TGT GTG TTA TTG 432 
He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
220 225 230 



-T AAC AAA TAC CAT TTT TTA GAA GGA AAT ACC GAA AAG TTA TTT TTA 480 
p Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
235 240 245 



AGC TTT ATT GTT TTA TTG GGG GTG CTT ATG GTG AGC AAT ATC CGC TAC 528 
Ser Phe He Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
250 255 260 265 

CCT AAT TTT AAA AAA GTC AAA TGG AAT CTC AAG CTT TTT ATC TTA GTG 576 
Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
270 275 280 

TTG ATT TTT TTA TCG TTA GTG TTT GTG CGC CCT TTA GAG GCT TTA AGC 624 
Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
285 290 295 

GTG TTT ATG GGG TTG TAT TTG ATT TAT GGC ATC ATT CGG TGG CTT TTT 672 
Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
300 305 310 



TTA ATG GTA AAA ATT ATT TTT AAT AAA AAT AAA AGT GCA TGA 714 
Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
315 320 325 



2) ANGABEN ZU SEQ ID NO: 6: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 23 8 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 6: 

Met Pro He Asn Pro Leu Tyr Leu Phe Pro Asn Leu Phe Thr Ala Ser 
15 10 15 

Ser He Phe Leu Gly Met Met Ser He Phe Tyr Ala Ser Ser Tyr Gin 
20 25 30 
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Phe Val Met Ala Cys Trp Leu Val Val Ala Ser Leu lie Leu Asp Gly 
35 40 45 

Leu Asp Gly Arg Val Ala Arg Leu Thr Asn Thr Thr Ser Lys Phe Gly 
50 55 60 

He Glu Phe Asp Ser Leu Ala Asp Val He Ala Phe Gly Val Ala Pro 
65 70 75 80 

Ser Leu He Thr Tyr Phe Tyr Val Gly Tyr Asn Phe Gly Arg He Gly 

85 90 95 

Met Ala Val Ser Ala Leu Phe Val He Phe Gly Ala He Arg Leu Ala 
100 105 HO 

Arg Phe Asn He Ser Thr Asn Thr Ser Asp Pro Tyr Ser Phe He Gly 
115 120 125 



He Pro He Pro Ala Ala Ala Val Leu Val Val Leu Cys Val Leu Leu 
130 135 140 



p Asn Lys Tyr His Phe Leu Glu Gly Asn Thr Glu Lys Leu Phe Leu 
45 150 155 160 

Ser Phe lie Val Leu Leu Gly Val Leu Met Val Ser Asn He Arg Tyr 
165 170 175 

Pro Asn Phe Lys Lys Val Lys Trp Asn Leu Lys Leu Phe He Leu Val 
180 185 190 

Leu He Phe Leu Ser Leu Val Phe Val Arg Pro Leu Glu Ala Leu Ser 
195 200 205 

Val Phe Met Gly Leu Tyr Leu He Tyr Gly He He Arg Trp Leu Phe 
210 215 220 

Leu Met Val Lys He He Phe Asn Lys Asn Lys Ser Ala * 
225 230 235 

(2) ANGABEN ZU SEQ ID NO : 7: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 552 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE : linear 

(vii) UNM I TTELBARE HERKUNFT: 

<B) CLON(E) : HPC029 (HPC030) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..552 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 7; 

ATG GCA GAA GAA CAA GAA AAT ACC GCG CAA CAA CCC CAA AAA AAA AGC 4 8 

Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
240 245 250 
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AAA GCC CTT TTA TTT GTC ATT ATT GGA AGC GTG TTA GTG ATG CTT TTG 96 
Lys Ala Leu Leu Phe Val lie lie Gly Ser Val Leu Val Met Leu Leu 
255 260 265 270 

TTG GTG GGG GTG ATT ATC ATG CTG CTT ATG GGG AAT AAG GAA GAA TCC 144 
Leu Val Gly Val lie He Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
275 280 285 

AAA GAA AAC GCT TCT AAA AAC ACC CAA GAA GTC CAA GCT AAT CCT ATG 192 
Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
290 295 300 

GCG AAC AAA AAT CAA GAA GCC AAA GAA GGC TCT AAT ATC CAG CAA TAT 240 
Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn He Gin Gin Tyr 
305 310 315 

CTG GTG CTT GGG CCT TTG TAT GCG ATT GAT GCG CCT TTT GCG GTG AAT 2 88 

Leu Val Leu Gly Pro Leu Tyr Ala He Asp Ala Pro Phe Ala Val Asn 
320 325 330 

TG GTT TCT CAA AAT GGC AGA CGC TAC CTT AAG GCT TCC ATT TCG TTA 33 6 

|eu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser He Ser Leu 
35 340 345 350 

GAA TTG AGC AAT GAA AAG CTT TTA AAT GAA GTC AAG GTT AAA GAC ACA 384 
Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
355 360 365 

GCG ATT AAG GAC ACG ATT ATA GAG ATT CTA TCG TCT AAA AGC GTG GAA 432 
Ala He Lys Asp Thr He He Glu He Leu Ser Ser Lys Ser Val Glu 
370 375 380 



GAA GTG GTT ACT AAC AAA GGT AAA AAC AAG CTT AAA GAT GAA ATT AAG 480 
Glu Val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu He Lys 
385 390 395 

AGC CAT TTG AAT TCG TTT TTG ATT GAT GGC TTT ATT AAA AAT GTC TTT 528 
Ser His Leu Asn Ser Phe Leu He Asp Gly Phe He Lys Asn Val Phe 
Ann a r\c 



400 405 410 

TTC ACT GAT TTC ATT ATT CAA TAA 552 
Phe Thr Asp Phe He He Gin * 
"5 420 



2 ) ANGABEN ZU SEQ ID NO : 8 : 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 184 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 8: 

Met Ala Glu Glu Gin Glu Asn Thr Ala Gin Gin Pro Gin Lys Lys Ser 
1 5 10 15 

Lys Ala Leu Leu Phe Val He He Gly Ser Val Leu Val Met Leu Leu 
20 25 30 



Leu Val Gly Val lie lie Met Leu Leu Met Gly Asn Lys Glu Glu Ser 
35 40 45 

Lys Glu Asn Ala Ser Lys Asn Thr Gin Glu Val Gin Ala Asn Pro Met 
50 55 60 

Ala Asn Lys Asn Gin Glu Ala Lys Glu Gly Ser Asn lie Gin Gin Tyr 
65 70 75 80 

Leu Val Leu Gly Pro Leu Tyr Ala lie Asp Ala Pro Phe Ala Val Asn 

85 90 95 

Leu Val Ser Gin Asn Gly Arg Arg Tyr Leu Lys Ala Ser lie Ser Leu 
100 105 110 

Glu Leu Ser Asn Glu Lys Leu Leu Asn Glu Val Lys Val Lys Asp Thr 
115 120 125 



^^^^ 



Ala lie Lys Asp Thr lie lie Glu lie Leu Ser Ser Lys Ser Val Glu 
130 135 140 



u Val Val Thr Asn Lys Gly Lys Asn Lys Leu Lys Asp Glu lie Lys 
4 5 150 155 160 

Ser His Leu Asn Ser Phe Leu lie Asp Gly Phe lie Lys Asn Val Phe 
165 170 175 

Phe Thr Asp Phe lie He Gin * 
180 

(2) ANGABEN ZU SEQ ID NO: 9: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 858 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 

(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS042 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..858 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 9: 

ATG AAA GAG TTT AAG ATT CTA ATC ATC CTC ATT GTG GTG GTA GGC GTG 
Met Lys Glu Phe Lys He Leu He He Leu He Val Val Val Gly Val 
i8S 190 195 200 

ATT TAT TAT GGG GTT GAG CCT TAT GCG CAT TCG GTG ATG CAC CCT AAA 
He Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
205 210 215 



GTC GCT CCG GCA GAT TTT GCT TTC AAG GAT TTA GAG CCG ATG GAT TTA 
Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
220 225 230 
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AAA AAT GGC GAT GCT AAT AAG GGC AAA CAG CTT GTA GCT GAA AAT TGC 192 
Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
235 240 245 

ACC GCT TGC CAT GGC ATT AAA TCC CAA AAC ATT CCA GCC CCT ATG GAC 24 0 

Thr Ala Cys His Gly He Lys Ser Gin Asn He Pro Ala Pro Met Asp 
250 255 260 

AGC CTT AGC GCG AGC AAC TCT TTT GGG GTC GTG CCA CCG GAT TTA AGC 2 88 

Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 
265 270 275 280 

CAT GTG GCG GGG GTT TTG AAC GCG AAT TTC TTA GCC CAC TTC ATC AAA 336 
His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe lie Lys 
285 290 295 

GAC CCT GTA AAA ACG GCG AAA TTG AGC CAT AAG TTC AAC GAT GAA AGG 3 84 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
300 305 310 

CC TAT CCT ATG CCG GCG TTT TCT CAA TTT AGC GAT AAA GAC TTG AGC 432 
ro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
315 320 325 

GAT ATT GTG GCG TAT CTC ACT TCT ATT TTG CCT AAA AAT TTG AGC GAT 4 80 

Asp He Val Ala Tyr Leu Thr Ser He Leu Pro Lys Asn Leu Ser Asp 
330 335 340 

AAG GAA GTG TTC GCG CAA AGC TGT CAA AGG TGC CAT AGC TTG GAT TAT 528 
Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
345 350 355 360 

GCG AAA GAT AAG GCC TTT AGC GAT CCT AAA GAT CTA GCC AAT TAT TTA 576 
Ala Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
365 370 375 

GGC TCT CAT GCA CCT GAT TTG TCC ATG ATG ATT AGA GCT AAA GGC GAA 624 
Gly Ser His Ala Pro Asp Leu Ser Met Met He Arg Ala Lys Gly Glu 
380 385 390 

CAT GGT TTG AAT ATT TTC ATC AAC GAT CCG CAA AAG CTT TTG CCT GGC 672 
His Gly Leu Asn He Phe He Asn Asp Pro Gin Lys Leu Leu Pro Gly 
^ 395 400 405 



'G GCT ATG CCC AGA GTG GGA TTG AGT GAA CAA GCT CAA AAA CAA GTC 720 
'hr Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
410 415 420 

ATC GCA TAT TTG GAA AAA GCA GGC GAT AGG AAA AAA CAT GAA AGG AAT 768 
He Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
425 430 435 440 

ACC TTA GGG ATA AAA ATC ATG ATT TTC TTT GCG GTG CTG TCG TTC TTG 816 
Thr Leu Gly He Lys lie Met He Phe Phe Ala Val Leu Ser Phe Leu 
445 450 455 

GCT TAT GCG TGG AAA AGA AAA GTT TGG AGC GAA GTG CAT TGA 858 
Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
460 465 470 
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(2) ANGABEN ZU SEQ ID NO: 10: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 286 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 10: 

Met Lys Glu Phe Lys lie Leu lie lie Leu lie Val Val Val Gly Val 
15 10 15 

lie Tyr Tyr Gly Val Glu Pro Tyr Ala His Ser Val Met His Pro Lys 
20 25 30 

Val Ala Pro Ala Asp Phe Ala Phe Lys Asp Leu Glu Pro Met Asp Leu 
35 40 45 

Lys Asn Gly Asp Ala Asn Lys Gly Lys Gin Leu Val Ala Glu Asn Cys 
SO 55 60 

hr Ala Cys His Gly lie Lys Ser Gin Asn lie Pro Ala Pro Met Asp 
65 70 75 80 

Ser Leu Ser Ala Ser Asn Ser Phe Gly Val Val Pro Pro Asp Leu Ser 

85 90 95 

His Val Ala Gly Val Leu Asn Ala Asn Phe Leu Ala His Phe lie Lys 
100 105 110 

Asp Pro Val Lys Thr Ala Lys Leu Ser His Lys Phe Asn Asp Glu Arg 
115 120 125 

Pro Tyr Pro Met Pro Ala Phe Ser Gin Phe Ser Asp Lys Asp Leu Ser 
130 135 140 

Asp lie Val Ala Tyr Leu Thr Ser lie Leu Pro Lys Asn Leu Ser Asp 
145 150 155 160 

Lys Glu Val Phe Ala Gin Ser Cys Gin Arg Cys His Ser Leu Asp Tyr 
165 170 175 

a Lys Asp Lys Ala Phe Ser Asp Pro Lys Asp Leu Ala Asn Tyr Leu 
180 185 190 

Gly Ser His Ala Pro Asp Leu Ser Met Met lie Arg Ala Lys Gly Glu 
195 200 205 

His Gly Leu Asn lie Phe lie Asn Asp Pro Gin Lys Leu Leu Pro Gly 
210 215 220 

Thr Ala Met Pro Arg Val Gly Leu Ser Glu Gin Ala Gin Lys Gin Val 
22 5 230 235 240 

lie Ala Tyr Leu Glu Lys Ala Gly Asp Arg Lys Lys His Glu Arg Asn 
245 250 255 

Thr Leu Gly lie Lys lie Met lie Phe Phe Ala Val Leu Ser Phe Leu 
260 265 270 
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Ala Tyr Ala Trp Lys Arg Lys Val Trp Ser Glu Val His * 
275 280 285 

(2) ANGABEN ZU SEQ ID NO: 11: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 192 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC057 (HPC109, HPC138) 

(ix) MERKMAL : 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..192 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

£TG AAT ACA GAA ATT TTA ACC ATC ATG TTA GTT GTC TCA GTG CTT ATG 48 
■~t Asn Thr Glu lie Leu Thr lie Met Leu Val Val Ser Val Leu Met 
290 295 300 

GGA TTG GTA GGC TTA ATA GCG TTT TTG TGG GGG GTT AAA AGC GGT CAG 96 
Gly Leu Val Gly Leu lie Ala Phe Leu Trp Gly Val Lys Ser Gly Gin 
305 310 315 

TTT GAC GAT GAA AAA CGC ATG CTT GAA AGC GTG TTG TAT GAC AGC GTG 144 
Phe Asp Asp Glu Lys Arg Met Leu Glu Ser Val Leu Tyr Asp Ser Val 
320 325 330 

AGC GAT TTG AAC GAA GCG ATT TTA CAA GAA AAA CGC CAA AAG AAT TAA 192 
Ser Asp Leu Asn Glu Ala lie Leu Gin Glu Lys Arg Gin Lys Asn * 
335 340 345 350 



(2) ANGABEN ZU SEQ ID NO: 12: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 64 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 



Met Asn Thr Glu lie Leu Thr lie 
1 5 

Gly Leu Val Gly Leu He Ala Phe 
20 

Phe Asp Asp Glu Lys Arg Met Leu 
35 40 



Met Leu Val Val Ser Val Leu Met 
10 15 

Leu Trp Gly Val Lys Ser Gly Gin 
25 30 

Glu Ser Val Leu Tyr Asp Ser Val 
45 



Ser Asp Leu Asn Glu Ala He Leu Gin Glu Lys Arg Gin Lys Asn * 
50 55 60 
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(2) ANGABEN ZU SEQ ID NO: 13: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 

(vii) UNM I TTE LB ARE HERKUNFT: 

(B) CLON(E) : HPS062 (HPS171) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..957 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 13: 

ATG CCC GAT TCT GCG AAC ATG ATC ATT TTA TTT TTC ACC TAT GAT ATT 
Met Pro Asp Ser Ala Asn Met He He Leu Phe Phe Thr Tyr Asp He 
65 70 75 80 

TA TTC GCT CTC AAT TAC ACC TTG CCC ATT TCC TTG CTT TTG GCG ATG 
eu Phe Ala Leu Asn Tyr Thr Leu Pro He Ser Leu Leu Leu Ala Met 
85 90 95 

GTT TTA TTT TAT ATC GCA TTC ATT AAA TCC AAC CAA TAC ACC GCC CTG 
Val Leu Phe Tyr He Ala Phe He Lys Ser Asn Gin Tyr Thr Ala Leu 
100 105 110 

CTC TCC ATT GGC TTT TCC AAA TGC CAG ATT TTA AGC CCT ATT TTT TTG 
Leu Ser He Gly Phe Ser Lys Cys Gin He Leu Ser Pro He Phe Leu 
115 120 125 

ATT AGT CTG TTT TTC ACG GCT ATT TAT GTG GGG TTG AAC GCG ACT CCT 
He Ser Leu Phe Phe Thr Ala He Tyr Val Gly Leu Asn Ala Thr Pro 
130 135 140 

TTT GTG TAT ATG GAA GAA AAA ACG CAA AAT TTA ATC TAT AAA GAC AAT 
Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu He Tyr Lys Asp Asn 
14 5 150 155 160 



TCT TTG AGC GTC TCA GAG CAT TTG TTA GTG AAA TAT AAC GAT GAT TAC 
"er Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
165 170 175 



TG TAT TTT GAT AAG ATT AAT CCC CTA TTG CAA AAA GCC CAA AAC ATC 
Val Tyr Phe Asp Lys He Asn Pro Leu Leu Gin Lys Ala Gin Asn He 
180 185 190 

AAG GTT TTT CGC CTA AAA GAT AAG ACT TTA GAA TCT TAC GCT GAA GCT 
Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
195 200 205 

AAA GAA GCT TTT TTT GAA GAC AAG TAT TGG ATT TTG CAT GAC ACT ACT 
Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp He Leu His Asp Thr Thr 
210 215 220 

ATC TAT GAG ATG CCC TTG AGT TTT GAA CTG GGT GCA AAC GCT TTA AGC 
He Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
225 230 235 240 
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ACC ACG CGT TTA AAA ACC TTT AAA ACG CTC AAA AAT TTC CGC CCT AAA 
Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
245 250 255 

GTT TTA GAC ACC ATT TAT CAA AAC AAG CCC GCG GTT TCT ATC ACA GAC 
Val Leu Asp Thr He Tyr Gin Asn Lys Pro Ala Val Ser He Thr Asp 
260 265 270 

GCT CTT TTA TCT TTG CAT GCT TTA GTG CGC CAA AAC GCA GAC ACG AAA 
Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
275 280 285 

AAA GTG CGA TCG TTT TTG TAT GTG TTT GCG ATT TTG CCC TTT TTT GTG 
Lys Val Arg Ser Phe Leu Tyr Val Phe Ala He Leu Pro Phe Phe Val 
290 295 300 

CCG TTT TTA AGC GTT TTA ATC GCT TAT TTT TCG CCC AGT CTC GCC CGC 
Pro Phe Leu Ser Val Leu He Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
305 310 315 320 



J^^^A 1 



AT GAA AAC CTG GCT CTT TTA GGG CTA AAG TTT ATC ATT ATC ACG CTC 
r Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe He He He Thr Leu 
325 330 335 



GTT GTT TGG GGG CTA TTC TTT GCT TTA GGG AAG TTC AGC ATT TCA GGG 
Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser He Ser Gly 
340 345 350 

ATA CTC ATT CCT GAA ATA GGC GTG CTA TCG CCC TTT TTT ATA TTC TTA 
He Leu He Pro Glu He Gly Val Leu Ser Pro Phe Phe He Phe Leu 
355 360 365 

GCT CTT AGT CTT TGG TAT TTT AAA AAG CTT AAT AAG AGG TTG TAG 
Ala Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu * 
370 375 380 

(2) ANGABEN ZU SEQ ID NO: 14: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Met Pro Asp Ser Ala Asn Met lie He Leu Phe Phe Thr Tyr Asp He 
15 10 15 

Leu Phe Ala Leu Asn Tyr Thr Leu Pro lie Ser Leu Leu Leu Ala Met 
20 25 30 

Val Leu Phe Tyr He Ala Phe lie Lys Ser Asn Gin Tyr Thr Ala Leu 
35 40 45 

Leu Ser He Gly Phe Ser Lys Cys Gin lie Leu Ser Pro He Phe Leu 
50 55 60 



He Ser Leu Phe Phe Thr Ala lie Tyr Val Gly Leu Asn Ala Thr Pro 
65 70 75 80 
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Phe Val Tyr Met Glu Glu Lys Thr Gin Asn Leu lie Tyr Lys Asp Asn 

85 90 95 

Ser Leu Ser Val Ser Glu His Leu Leu Val Lys Tyr Asn Asp Asp Tyr 
100 105 110 

Val Tyr Phe Asp Lys lie Asn Pro Leu Leu Gin Lys Ala Gin Asn lie 
115 120 125 

Lys Val Phe Arg Leu Lys Asp Lys Thr Leu Glu Ser Tyr Ala Glu Ala 
130 135 140 

Lys Glu Ala Phe Phe Glu Asp Lys Tyr Trp lie Leu His Asp Thr Thr 
145 150 155 160 

lie Tyr Glu Met Pro Leu Ser Phe Glu Leu Gly Ala Asn Ala Leu Ser 
165 170 175 

Thr Thr Arg Leu Lys Thr Phe Lys Thr Leu Lys Asn Phe Arg Pro Lys 
180 185 190 

1 Leu Asp Thr lie Tyr Gin Asn Lys Pro Ala Val Ser lie Thr Asp 
195 200 205 

Ala Leu Leu Ser Leu His Ala Leu Val Arg Gin Asn Ala Asp Thr Lys 
210 215 220 

Lys Val Arg Ser Phe Leu Tyr Val Phe Ala lie Leu Pro Phe Phe Val 
225 230 235 240 

Pro Phe Leu Ser Val Leu lie Ala Tyr Phe Ser Pro Ser Leu Ala Arg 
245 250 255 

Tyr Glu Asn Leu Ala Leu Leu Gly Leu Lys Phe lie lie He Thr Leu 
260 265 270 

Val Val Trp Gly Leu Phe Phe Ala Leu Gly Lys Phe Ser He Ser Gly 
275 280 285 



He Leu lie Pro Glu He Gly Val Leu Ser Pro Phe Phe He Phe Leu 
290 295 300 



a Leu Ser Leu Trp Tyr Phe Lys Lys Leu Asn Lys Arg Leu 
5 310 315 



2) ANGABEN ZU SEQ ID NO: 15: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1629 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 

(vii) UNM I TTE LB ARE HERKUNFT : 

(B) CLON(E) : HPS065 (HPS153) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1629 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 
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ATG AAT AAA CCA TTT TTA ATC TTA CTC ATA GCC CTA ATT GTC TTT AGC 4 8 

Met Asn Lys Pro Phe Leu He Leu Leu He Ala Leu He Val Phe Ser 
320 325 330 335 

GGC TGT AAC ATG AGA AAA TAT TTC AAA CCC GCT AAA CAC CAA ATT AAA 96 
Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin He Lys 
340 345 350 

GGC GAA GCG TAT TTC CCT AAC CAT TTG CAA GAA AGT ATC GTT TCG TCT 144 
Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser He Val Ser Ser 
355 360 365 

AAT CGT TAT GGA GCC ATT TTG AAA AAT GGA GCG GTT ATA GGC GAT AAA 192 
Asn Arg Tyr Gly Ala He Leu Lys Asn Gly Ala Val He Gly Asp Lys 
370 375 380 

GGT TTA ACG CAG CTA AGA ATC GGT AAG AAC TTC AAT TAC GAA AGC AGT 240 
Gly Leu Thr Gin Leu Arg He Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
385 390 395 



0 



™ ly: 



ITT TTA AAT GAG AGT CAA GGG TTT TTT ATT CTT GCG CAA GAT TGT TTG 2 88 

he Leu Asn Glu Ser Gin Gly Phe Phe He Leu Ala Gin Asp Cys Leu 
00 405 410 415 

AAC AAG ATT GAT AAA AAA ACA AAC AAA AGC AAG GTG GCT AAG ACT GAA 336 
Asn Lys He Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
420 425 430 

GAA ACG GAA TTG AAA TTA AAG GGC GTT GAA GCG GAA GTC CAA GAT AAA 384 
Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
435 440 445 

GTC TGT CAT CAA GTG GAA TTG ATT AGC AAT AAC CCT AAC GCC AGC CAA 432 
Val Cys His Gin Val Glu Leu He Ser Asn Asn Pro Asn Ala Ser Gin 
450 455 460 

CAA TCT ATC GTT ATT CCT TTG GAG ACT TTT GCC TTG AGC GCA AGC GTT 480 
Gin Ser He Val He Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
465 470 475 

AAA GGG AAT CTT TTA GCG GTG GTG TTA GCG GAC AAT TCA GCG AAC TTA 52 8 

Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 

485 490 495 

r >C GAC ATC ACT TCT CAA AAA TTG CTT TTT AGT GAG AAA GGT TCC CCA 576 
yr Asp He Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
500 505 510 

AGC ACC ACG ATC AAT TCT TTA ATG GCG ATG CCT ATT TTT ATG GAT ACG 624 
Ser Thr Thr He Asn Ser Leu Met Ala Met Pro He Phe Met Asp Thr 
515 520 525 

GTC GTG GTG TTC CCC ATG CTA GAT GGG CGC TTG TTG GTC GTG GAT TAT 672 
Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
530 535 540 

GTG CAC GGA AAC CCT ACG CCT ATT AGA AAC ATT GTT ATC AGC AGC GAT 720 
Val His Gly Asn Pro Thr Pro He Arg Asn He Val He Ser Ser Asp 
545 550 555 



AAG TTT TTT AAC AAT ATC ACC TAC CTT ATC GTA GAT GGC AAT AAC ATG 
Lys Phe Phe Asn Asn lie Thr Tyr Leu lie Val Asp Gly Asn Asn Met 
560 565 570 575 

ATC GCT TCT ACA GGG AAA AGG ATA CTC TCA GTA GTG AGC GGT CAA GAG 
lie Ala Ser Thr Gly Lys Arg lie Leu Ser Val Val Ser Gly Gin Glu 
580 585 590 

TTC AAC TAT GAT GGG GAT ATT GTG GAT TTG CTT TAT GAT AAG GGG ACT 
Phe Asn Tyr Asp Gly Asp lie Val Asp Leu Leu Tyr Asp Lys Gly Thr 
595 600 605 

TTA TAT GTG CTC ACG CTA GAC GGG CAG ATT TTG CAA ATG GAT AAG AGT 
Leu Tyr Val Leu Thr Leu Asp Gly Gin lie Leu Gin Met Asp Lys Ser 
610 615 620 

TTG AGG GAA TTA AAC AGC GTG AAA CTG CCT TCG TCG CTC AAC ACG ATT 
Leu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr lie 
625 630 635 



iTA TTA AAC CAT AAT AAA TTG TAT TCT TTA GAA AAA CGA GGG TAT GTG 
1 Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
40 645 650 655 



ATA GAG GTG GAT TTA AAT GAT TTT GAT TCG TAT AAT GTC TAT AAA ACG 
lie Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
660 665 670 

CCA ACT ATA GGC AGT TTT AAG TTT TTT TCA TCT AAT CGT TTG GAT AAA 
Pro Thr lie Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
675 680 685 

GGG GTG TTT TAT GAT AAA AAT CGG GTG TAT TAC GAT CGC TAC TAT TTA 
Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
690 695 700 

GAT TAT AAC GAT TTT AAA CCA AAA CTT TAT CCC GTT GTG GAA AAA TCG 
Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
705 710 715 



•I 
e- 



GCA TCT AAA AAA TCT CAA AAA GGC GAA AAA GGG AAC GCT CCT ATT TAT 
Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro lie Tyr 
"20 725 730 735 



G CAA GAA AGG CAT AAA GCT AAA GAA AAT AAA CAG CCT TTA GAA GAA 
eu Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
740 745 750 

AAC AAA GTT AAA CCA AGA AAT AGC GGG TTT GAA GAA GAA GAG GTT AAA 
Asn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
755 760 765 

ACC AGA AGG CCT GAG CCT ATT AGG GAT CAA AAT AAC GCC ACC CAA CAA 
Thr Arg Arg Pro Glu Pro lie Arg Asp Gin Asn Asn Ala Thr Gin Gin 
770 775 780 



GGC GAA ACA AAA AAC AAT GAA AGT AAA AAC GCT CCT GTC TTA AAA GAA 
Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
785 790 795 
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AAC GCC GCT AAA AAA GAA GTG CCA AAA CCA AAT TCT AAA GAA GAA AAA 1488 
Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
800 805 810 815 

CGC CGC TTG AAA GAA GAA AAG AAA AAA GCC AAA GCC GAA CAA AGA GCG 153 6 

Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
820 825 830 

AGA GAA TTT GAA CAA AGA GCG AGA GAG CAT CAA GAA AGA GAT GAA AAA 1584 
Arg Glu Phe Glu Gin Arg Ala Arg Glu His Gin Glu Arg Asp Glu Lys 
835 840 845 

GAG CTT GAA GAA AGA AGA AAA GCT TTA GAA ATG AAT AAG AAG TAG 1629 
Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys * 
850 855 860 

(2) ANGABEN ZU SEQ ID NO: 16: 

(i) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 543 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 16: 

Met Asn Lys Pro Phe Leu lie Leu Leu lie Ala Leu lie Val Phe Ser 
15 10 15 

Gly Cys Asn Met Arg Lys Tyr Phe Lys Pro Ala Lys His Gin lie Lys 
20 25 30 

Gly Glu Ala Tyr Phe Pro Asn His Leu Gin Glu Ser lie Val Ser Ser 
35 40 45 

Asn Arg Tyr Gly Ala lie Leu Lys Asn Gly Ala Val lie Gly Asp Lys 
50 55 60 

Gly Leu Thr Gin Leu Arg lie Gly Lys Asn Phe Asn Tyr Glu Ser Ser 
65 70 75 80 



^^^s: 



jje Leu Asn Glu Ser Gin Gly Phe Phe lie Leu Ala Gin Asp Cys Leu 
85 90 95 



sn Lys lie Asp Lys Lys Thr Asn Lys Ser Lys Val Ala Lys Thr Glu 
100 105 110 

Glu Thr Glu Leu Lys Leu Lys Gly Val Glu Ala Glu Val Gin Asp Lys 
115 120 125 

Val Cys His Gin Val Glu Leu lie Ser Asn Asn Pro Asn Ala Ser Gin 
130 135 140 

Gin Ser lie Val lie Pro Leu Glu Thr Phe Ala Leu Ser Ala Ser Val 
145 150 155 160 

Lys Gly Asn Leu Leu Ala Val Val Leu Ala Asp Asn Ser Ala Asn Leu 
165 170 175 

Tyr Asp lie Thr Ser Gin Lys Leu Leu Phe Ser Glu Lys Gly Ser Pro 
180 185 190 
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Ser Thr Thr lie Asn Ser Leu Met Ala Met Pro lie Phe Met Asp Thr 
195 200 205 

Val Val Val Phe Pro Met Leu Asp Gly Arg Leu Leu Val Val Asp Tyr 
210 215 220 

Val His Gly Asn Pro Thr Pro lie Arg Asn lie Val lie Ser Ser Asp 
225 230 235 240 

Lys Phe Phe Asn Asn lie Thr Tyr Leu lie Val Asp Gly Asn Asn Met 
245 250 255 

lie Ala Ser Thr Gly Lys Arg lie Leu Ser Val Val Ser Gly Gin Glu 
260 265 270 

Phe Asn Tyr Asp Gly Asp lie Val Asp Leu Leu Tyr Asp Lys Gly Thr 
275 280 285 



Leu Tyr Val Leu Thr Leu Asp Gly Gin lie Leu Gin Met Asp Lys Ser 
290 295 300 



ieu Arg Glu Leu Asn Ser Val Lys Leu Pro Ser Ser Leu Asn Thr lie 
05 310 315 320 

Val Leu Asn His Asn Lys Leu Tyr Ser Leu Glu Lys Arg Gly Tyr Val 
325 330 335 

lie Glu Val Asp Leu Asn Asp Phe Asp Ser Tyr Asn Val Tyr Lys Thr 
340 345 350 

Pro Thr lie Gly Ser Phe Lys Phe Phe Ser Ser Asn Arg Leu Asp Lys 
355 360 365 

Gly Val Phe Tyr Asp Lys Asn Arg Val Tyr Tyr Asp Arg Tyr Tyr Leu 
370 375 380 

Asp Tyr Asn Asp Phe Lys Pro Lys Leu Tyr Pro Val Val Glu Lys Ser 
385 390 395 400 



Ala Ser Lys Lys Ser Gin Lys Gly Glu Lys Gly Asn Ala Pro lie Tyr 
405 410 415 



^u Gin Glu Arg His Lys Ala Lys Glu Asn Lys Gin Pro Leu Glu Glu 
420 425 430 



sn Lys Val Lys Pro Arg Asn Ser Gly Phe Glu Glu Glu Glu Val Lys 
435 440 445 

Thr Arg Arg Pro Glu Pro lie Arg Asp Gin Asn Asn Ala Thr Gin Gin 
450 455 460 

Gly Glu Thr Lys Asn Asn Glu Ser Lys Asn Ala Pro Val Leu Lys Glu 
465 470 475 480 

Asn Ala Ala Lys Lys Glu Val Pro Lys Pro Asn Ser Lys Glu Glu Lys 
485 490 495 

Arg Arg Leu Lys Glu Glu Lys Lys Lys Ala Lys Ala Glu Gin Arg Ala 
500 505 510 

Arg Glu Phe Glu Gin Arg Ala Arg Glu Hie Gin Glu Arg Asp Glu Lys 
515 520 525 
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Glu Leu Glu Glu Arg Arg Lys Ala Leu Glu Met Asn Lys Lys * 
530 535 540 

(2) ANGABEN ZU SEQ ID NO: 17: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1377 Basenpaare 
<B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 

(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS066 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1377 



• 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 17: 

,TG CTT GAA ACT TCT AGC CAT TTT TTA AAA TCG TTT CGC TTG AAG CGT 48 
et Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 
545 550 555 



TAT ATA GGG TTT TTA TTG ATT TCT TTA GCG TTA TTA ATC ACG CCC TTT 96 
Tyr lie Gly Phe Leu Leu lie Ser Leu Ala Leu Leu lie Thr Pro Phe 
560 565 570 575 

GTT CGC ATT GAT GGG GCG CAT TTG TTT TTG ATC TCT TTT GAG CAT AAG 144 
Val Arg lie Asp Gly Ala His Leu Phe Leu lie Ser Phe Glu His Lys 
580 585 590 

CAA CTG CAT TTT TTA GGC AAG ATC TTT AGC GCT GAA GAA TTG CAA GTC 192 
Gin Leu His Phe Leu Gly Lys lie Phe Ser Ala Glu Glu Leu Gin Val 
595 600 605 

ATG CCT TTT ATG GTT ATT TTG CTT TTT ATA GGG ATT TTT TTC ATC ACC 24 0 

Met Pro Phe Met Val lie Leu Leu Phe lie Gly lie Phe Phe lie Thr 
610 615 620 



ACT AGC CTT GGG CGT GTG TGG TGC GGT TGG GCT TGC CCG CAA ACC TTT 288 
hr Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin Thr Phe 
625 630 635 



TTA AGG GTG CTT TAT AGA GAT GTG ATT GAA ACC AAG ATT TTC AAA CTC 336 
Leu Arg Val Leu Tyr Arg Asp Val lie Glu Thr Lys lie Phe Lys Leu 
640 645 650 655 

CAT AAA AAG ATC AGC AAC AAG CAA GAA AGC CCT AAA AAC ACC CCA AGC 3 84 

His Lys Lys lie Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
660 665 670 

TAC AAG ATC CGT AAA GTA TTG AGC GTT TTA TTG TTC GCT CCT GTT GTG 4 32 

Tyr Lys lie Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
675 680 685 

GCG GGG CTA ATG ATG TTG TTT TTC TTT TAT TTC ATC GCC CCA GAA GAT 4 80 

Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe lie Ala Pro Glu Asp 
690 695 700 

TTT TTT ATG TAT CTT AAA AAC CCT AGC GAT CAC CCT ATT GCT ATG GGT 52 8 
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Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro lie Ala Met Gly 
705 710 715 

TTT TGG CTT TTT AGC ACG GCT GTG GTG CTA TTT GAT ATA GTG GTG GTT 576 
Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp lie Val Val Val 
720 725 730 735 

GCG GAG CGT TTT TGC ATT TAT TTA TGC CCT TAC GCT AGG GTG CAA TCG 624 
Ala Glu Arg Phe Cys He Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 
740 745 750 

GTG TTG TAT GAC AAT GAC ACC TTA AAC CCT ATT TAT GAT GAA AAG CGC 672 
Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro He Tyr Asp Glu Lys Arq 
755 760 765 

GGC GGA GCG CTT TAT AAT AAT CAG GGC CAT CTC TTC CCC TTA CCT CCC 72 0 

Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
770 775 780 

AAA AAA CGC AGC CCA GAA AAC GAA TGC GTG AAT TGT TTG CAT TGC GTG 768 
^ T .ys Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
785 790 795 

CAG GTT TGC CCC ACG CAT ATT GAC ATC AGG AAG GGC TTG CAA TTA GAA 816 
Gin Val Cys Pro Thr His He Asp He Arg Lys Gly Leu Gin Leu Glu 
800 805 810 815 

TGC ATC AAT TGT TTA GAA TGC GTG GAT GCA TGC ACG ATT ACC ATG GCT 864 
Cys He Asn Cys Leu Glu Cys Val Asp Ala Cys Thr He Thr Met Ala 
820 825 830 

AAA TTT AAC CGC CCT TCA CTC ATC CAA TGG TCT TCA ACT AAC GCT ATT 912 
Lys Phe Asn Arg Pro Ser Leu He Gin Trp Ser Ser Thr Asn Ala He 
835 840 845 

AAT ACG CGC CAA AAA GTG CAC CTG GTG CGT TTA AAA ACG ATC GCT TAC 960 
Asn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr He Ala Tyr 
850 855 860 

ATG GGG GTT ATC GCT ATT GTG ATC GCT CTT TTA GCC ATC ACT TCG TTT 1008 
Met Gly Val He Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
865 870 875 

} AAA GAA CGC ATG CTC TTA GAC ATT AAC CGC AAC AGC GAT CTG TAT 1056 
w s Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
80 885 890 895 

GAA TTG CGC TCT AGC GGG TAT GTG GAT AAC GAT TAC GTG TTT TTA TTC 1104 
Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
900 905 910 

CAC AAC ACG GAC AAT AAA GAC CAT GAG TTT TAT TTC AAA GTT TTA GGG 1152 
His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
915 920 925 

CAA AAA GAC ATT CAG ATC AAA AAG CCT TTA AAT CCT ATC GCC ATT AAA 1200 
Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
930 935 940 

GCC GGG CAA AAG ATT AAA GCG GTA GTG ATT TTA AGA AAA CCC CTA AAG 124 8 

Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
945 950 955 



AGT AAC GCC ACA GAA TAC AAG AAC GCT AAA GAC GCT CTA ATC CCC ATT 
Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu lie Pro lie 
960 965 970 975 

ACC ATA CAA GCT TAT AGC GCG GAC GAT AAG AAT ATT ACG ATA GAA AGG 
Thr He Gin Ala Tyr Ser Ala Asp Asp Lys Asn He Thr He Glu Arg 
980 985 990 

GAA TCG GTG TTT ATT GCA CCA AGT GAG GAT TGA 
Glu Ser Val Phe He Ala Pro Ser Glu Asp * 
995 1000 




(2) ANGABEN ZU SEQ ID NO: 18: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 459 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 18: 

Met Leu Glu Thr Ser Ser His Phe Leu Lys Ser Phe Arg Leu Lys Arg 
1 5 10 15 

Tyr He Gly Phe Leu Leu He Ser Leu Ala Leu Leu He Thr Pro Phe 
20 25 30 

Val Arg He Asp Gly Ala His Leu Phe Leu He Ser Phe Glu His Lys 
35 40 45 

Gin Leu His Phe Leu Gly Lys He Phe Ser Ala Glu Glu Leu Gin Val 
50 55 60 

Met Pro Phe Met Val He Leu Leu Phe He Gly He Phe Phe He Thr 
65 70 75 80 

Thr Ser Leu Gly Arg Val Trp Cys Gly Trp Ala Cys Pro Gin Thr Phe 
85 90 95 

Leu Arg Val Leu Tyr Arg Asp Val He Glu Thr Lys He Phe Lys Leu 
100 105 110 

s Lys Lys He Ser Asn Lys Gin Glu Ser Pro Lys Asn Thr Pro Ser 
115 120 125 

Tyr Lys He Arg Lys Val Leu Ser Val Leu Leu Phe Ala Pro Val Val 
130 135 140 

Ala Gly Leu Met Met Leu Phe Phe Phe Tyr Phe He Ala Pro Glu Asp 
145 150 155 160 

Phe Phe Met Tyr Leu Lys Asn Pro Ser Asp His Pro He Ala Met Gly 
165 170 175 

Phe Trp Leu Phe Ser Thr Ala Val Val Leu Phe Asp He Val Val Val 
180 185 190 

Ala Glu Arg Phe Cys He Tyr Leu Cys Pro Tyr Ala Arg Val Gin Ser 
195 200 205 



Val Leu Tyr Asp Asn Asp Thr Leu Asn Pro lie Tyr Asp Glu Lys Ara 
210 215 220 

Gly Gly Ala Leu Tyr Asn Asn Gin Gly His Leu Phe Pro Leu Pro Pro 
225 230 235 240 

Lys Lys Arg Ser Pro Glu Asn Glu Cys Val Asn Cys Leu His Cys Val 
2 45 250 255 

Gin Val Cys Pro Thr His lie Asp lie Arg Lys Gly Leu Gin Leu Glu 
260 265 270 

Cys lie Asn Cys Leu Glu Cys Val Asp Ala Cys Thr lie Thr Met Ala 
275 280 285 

Lys Phe Asn Arg Pro Ser Leu lie Gin Trp Ser Ser Thr Asn Ala lie 
290 295 300 

Asn Thr Arg Gin Lys Val His Leu Val Arg Leu Lys Thr lie Ala Tyr 
305 310 315 320 

let Gly Val He Ala He Val He Ala Leu Leu Ala He Thr Ser Phe 
325 330 335 

Lys Lys Glu Arg Met Leu Leu Asp He Asn Arg Asn Ser Asp Leu Tyr 
340 345 350 

Glu Leu Arg Ser Ser Gly Tyr Val Asp Asn Asp Tyr Val Phe Leu Phe 
355 360 365 

His Asn Thr Asp Asn Lys Asp His Glu Phe Tyr Phe Lys Val Leu Gly 
370 375 380 

Gin Lys Asp He Gin He Lys Lys Pro Leu Asn Pro He Ala He Lys 
385 390 395 400 

Ala Gly Gin Lys He Lys Ala Val Val He Leu Arg Lys Pro Leu Lys 
405 410 415 

Ser Asn Ala Thr Glu Tyr Lys Asn Ala Lys Asp Ala Leu He Pro He 
420 425 430 

Thr He Gin Ala Tyr Ser Ala Asp Asp Lys Asn He Thr He Glu Arg 
435 440 445 

u Ser Val Phe He Ala Pro Ser Glu Asp * 
450 455 

(2) ANGABEN ZU SEQ ID NO: 19: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1533 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS068 



(ix) MERKMAL: 



(] 
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(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1533 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 19: 

ATG AAA AAA ACA ACC CTC TTT GTA TTG GGC TTA TTA TTT AAT AGC TTT 4 8 

Met Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
460 465 470 475 

TTA AAT GCT GTT GAT GGG ATT TCT AAA ACC GAT CTT TCT TCT TTG AAT 96 
Leu Asn Al* Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
480 485 490 

TTG GCT GAA GAC AGC GCG CCT TTG AAC CAT CCT AAC GCT CAA AAA CTC 144 
Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
495 500 505 

TCC TTA AAA AAC GCA TGG ACT AGG GTA TTG TCT AAC CAT GAA GGC TTG 192 
Ser Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
510 515 520 

^'AT GCG CAA GAA TAC GCC ATT AAG CGA GCG AGT AAA ATG AAA TTA GCG 240 
His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
525 530 535 

GCT AAA CTT TCT TTT TTG CCT CAA ATT GAT TTG AGC GCT TTT TAT GTG 288 
Ala Lys Leu Ser Phe Leu Pro Gin lie Asp Leu Ser Ala Phe Tyr Val 
540 545 550 555 

TAT CTC TCT AAC CCC ATT AAA ATG GAT TTT GCC AGC CAA AAA CAA CCG 336 
Tyr Leu Ser Asn Pro lie Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
560 565 570 

GGC GTG CAA AAA GCC ACC AAC CAG ATC CAT CAA GGC ATA CAA AAC ATC 384 
Gly Val Gin Lys Ala Thr Asn Gin He His Gin Gly He Gin Asn He 
575 580 585 

CAG CAA AAT ATC CCT TCT CAA GTA TTA ACC CCT CAA ATC CAA GCG GGC 432 
Gin Gin Asn He Pro Ser Gin Val Leu Thr Pro Gin He Gin Ala Gly 
590 595 600 

TG CAA GGG GTG ATG CAA GGT TTT GGG GCT TTG AGC AGC ACT TTA GAA 480 
Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
605 610 615 

GCC CCC TTA TTG TTT TCT AAG CAA AAT GTG GTG ATT GGG GCT TTG AGC 528 
Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val He Gly Ala Leu Ser 
620 625 630 635 

ATT ATT TAT CCC CTT TAT ATG GGT GGG GCA AGA TTC ACG ATG GTG CGC 576 
He He Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
640 645 650 

ATT GCG GAT TTG ATG CAA AAA GAT GCT AAT GAA GTG TAT CGT TTG AAA 624 
He Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
655 660 665 

AAG CTT TCC ACT TTT CAA GAG CTT GTG AGC GTG TAT TAC GGC ATG GTG 672 
Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
670 675 680 



9" 
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TTA AAC GCA GAA GTG GCT GAA ACT TTA GAA GAG GTG GAA AAA GGC CAT 720 

Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 

685 690 695 

TAT AAG CAT TTC CAA AAC GCT TTG AAA ATG CAA AAA GTG GGG CAA ATC 768 
Tyr Lys Hxs Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin lie 
700 705 710 715 

GCT AGG GTA GAA ACC TTA GGC GCT CAA GTG GCT TAT GAT AAG GCC CAT 816 
Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
720 725 730 

ATC GCT AGC GTT AAG GCT AAA GAC GTG TTA GAA GTT TCG CAG CTC TCG 864 
lie Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
735 740 745 

TTC AAT TCC ATT TTA TCT AGC AAG GAC GAT TTA GTG CCT TCA AGC AAA 912 
Phe Asn Ser He Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
750 755 760 

'A GAG ATC CGC ACG GAG AAA AAT CTG CCC GAT CTG AGC TTT TTT GTT 960 
.eu Glu He Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
765 770 775 

TCT TCC ACG CTC AAT TCC TAC CCG GTT TTA AAG ACT TTA GAA AAT CAG 100 8 

ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
780 785 790 " 795 

ATT CAA ATC TCT AAA GAA AAC ACG AAA TTA CAG ATC GCT AAA TTC TTG 1056 
He Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
800 805 810 

CCC CAA GTG AGT TTT TTT GGC TCT TAT ATT ATG AAG CAA AAC AAT TCG 1104 
Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
815 820 825 

GTG TTT GAA GAC ATG ATC CCT AGT TGG TTT GTG GGC GTG GCC GGG CGC 
Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
830 835 840 

ATG CCT ATT CTT TCT CCC ACA GGG CGC ATT CAA AAA TAC CAA GCG AGC 1200 
Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
845 850 855 



1152 



w TTA GCG GAG TTG CAA GTG AGT AGC GAA CAA ATC CAG GCT AAA AAA 124 8 

.ys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
860 865 870 875 

AAC ATG GAA TTA TTA GTG AAT AAG ACT TAT AAA GAG ACG CTT TCT TAT 1296 
Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
880 885 890 

TTG AAA GAA TAC AAA AGC TTG CTT TCT AGC GTG GAA TTA GCC AAG GAA 1344 
Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
895 900 905 

AAC TTA AAA CTC CAA GAG CAG GCT TTT TTA CAA GGC TTA AGC ACG AAC 13 92 

Asn Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
910 915 920 

GCT CAA GTC ATT GAT GCG AGG AAC ACG CTT TCT TCT ATC GTC GTG GAG 14 4 0 

Ala Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
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925 930 935 

CAA AAA AGC GTG GCT TAT AAA TAC ATC GTT TCA TTA GCG AAT TTA ATG 14 88 

Gin Lys Ser Val Ala Tyr Lys Tyr lie Val Ser Leu Ala Asn Leu Met 
94 ° 945 950 955 

GCG TTA AGC GAT CAT ATT GAT TTA TTT TAT GAA TTT GTT TAT TAA 1533 
Ala Leu Ser Asp His lie Asp Leu Phe Tyr Glu Phe Val Tyr * 
960 965 970 




(2) ANGABEN ZU SEQ ID NO: 20: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 511 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG : SEQ ID NO : 20: 

et Lys Lys Thr Thr Leu Phe Val Leu Gly Leu Leu Phe Asn Ser Phe 
1 5 10 15 

Leu Asn Ala Val Asp Gly lie Ser Lys Thr Asp Leu Ser Ser Leu Asn 
20 25 30 

Leu Ala Glu Asp Ser Ala Pro Leu Asn His Pro Asn Ala Gin Lys Leu 
35 40 45 

Ser Leu Lys Asn Ala Trp Thr Arg Val Leu Ser Asn His Glu Gly Leu 
50 55 60 

His Ala Gin Glu Tyr Ala lie Lys Arg Ala Ser Lys Met Lys Leu Ala 
65 70 75 80 

Ala Lys Leu Ser Phe Leu Pro Gin lie Asp Leu Ser Ala Phe Tyr Val 

85 90 95 

Tyr Leu Ser Asn Pro He Lys Met Asp Phe Ala Ser Gin Lys Gin Pro 
100 105 110 



y Val Gin Lys Ala Thr Asn Gin He His Gin Gly He Gin Asn He 
115 120 125 



In Gin Asn He Pro Ser Gin Val Leu Thr Pro Gin He Gin Ala Glv 
130 135 140 

Met Gin Gly Val Met Gin Gly Phe Gly Ala Leu Ser Ser Thr Leu Glu 
145 150 155 160 

Ala Pro Leu Leu Phe Ser Lys Gin Asn Val Val He Gly Ala Leu Ser 
165 170 175 

He He Tyr Pro Leu Tyr Met Gly Gly Ala Arg Phe Thr Met Val Arg 
180 185 190 

He Ala Asp Leu Met Gin Lys Asp Ala Asn Glu Val Tyr Arg Leu Lys 
- 195 200 205 

Lys Leu Ser Thr Phe Gin Glu Leu Val Ser Val Tyr Tyr Gly Met Val 
210 215 220 




Leu Asn Ala Glu Val Ala Glu Thr Leu Glu Glu Val Glu Lys Gly His 
225 230 235 240 

Tyr Lys His Phe Gin Asn Ala Leu Lys Met Gin Lys Val Gly Gin lie 
245 250 255 

Ala Arg Val Glu Thr Leu Gly Ala Gin Val Ala Tyr Asp Lys Ala His 
260 265 270 

lie Ala Ser Val Lys Ala Lys Asp Val Leu Glu Val Ser Gin Leu Ser 
275 280 285 

Phe Asn Ser He Leu Ser Ser Lys Asp Asp Leu Val Pro Ser Ser Lys 
290 295 300 

Leu Glu He Arg Thr Glu Lys Asn Leu Pro Asp Leu Ser Phe Phe Val 
305 310 315 320 

Ser Ser Thr Leu Asn Ser Tyr Pro Val Leu Lys Thr Leu Glu Asn Gin 
325 330 335 

le Gin He Ser Lys Glu Asn Thr Lys Leu Gin He Ala Lys Phe Leu 
340 345 350 

Pro Gin Val Ser Phe Phe Gly Ser Tyr He Met Lys Gin Asn Asn Ser 
355 360 365 

Val Phe Glu Asp Met He Pro Ser Trp Phe Val Gly Val Ala Gly Arg 
370 375 380 

Met Pro He Leu Ser Pro Thr Gly Arg He Gin Lys Tyr Gin Ala Ser 
385 390 395 400 

Lys Leu Ala Glu Leu Gin Val Ser Ser Glu Gin He Gin Ala Lys Lys 
405 410 415 

Asn Met Glu Leu Leu Val Asn Lys Thr Tyr Lys Glu Thr Leu Ser Tyr 
420 425 430 



Leu Lys Glu Tyr Lys Ser Leu Leu Ser Ser Val Glu Leu Ala Lys Glu 
435 440 445 



n Leu Lys Leu Gin Glu Gin Ala Phe Leu Gin Gly Leu Ser Thr Asn 
450 455 460 



la Gin Val He Asp Ala Arg Asn Thr Leu Ser Ser He Val Val Glu 
465 470 475 480 

Gin Lys Ser Val Ala Tyr Lys Tyr He Val Ser Leu Ala Asn Leu Met 
485 490 495 

Ala Leu Ser Asp His He Asp Leu Phe Tyr Glu Phe Val Tyr * 
500 505 510 

(2) ANGABEN ZU SEQ ID NO: 21: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 957 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 
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(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS074 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1. .957 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 21: 

ATG TTA AGT AGA GAC ATT GTC CAA TAT TCC AAG ATC CGC ACC GAG TTA 4 8 

Met Leu Ser Arg Asp He Val Gin Tyr Ser Lys He Arg Thr Glu Leu 
515 520 525 

TAC GCT TAT CTT ACC TAT TTG TTT TCG CAC AAT ATC CGC AAC CAC CTC 96 
Tyr Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn He Arg Asn His Leu 
530 535 540 

CCT GAA ATC ACT TTG GAT TAT TTA AAC AAA CAG ATC AGA AAA ATG CAC 144 
°ro Glu He Thr Leu Asp Tyr Leu Asn Lys Gin He Arg Lys Met His 
545 550 555 

GCT GAA ATC AAA ATG GCA AAA AAT TTT TTT GTG TTA GAC GCT AAG GGC 192 
Ala Glu He Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lys Glv 
5^0 565 570 575 

ATG CTA ATT CTT AAG CCA AGC CAG CTT AAA GAG CAG GGG CAT AAG GAA 240 
Met Leu He Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
580 585 590 

GGG ATA TTA GAG CAT GAT TTA ACA GAA GGG ATT GAA CTA GAA TCG CAT 288 
Gly He Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 
595 600 605 

GCC AGT TTT AGC GAT AAG TAT TAT TTT TAT CAA GCC GTG AGC GAA AAG 336 
Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
610 615 620 

CGT TGC ATT TTA ACG GAC CCC TAT CCT TCT AAA AAA GGA AAC CAT TTA 384 
Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
625 630 635 

*A GTG AGC GCG TCT TAC CCG GTG TAT GAT CAA AAT AAC GAT CTA GCG 432 
r il Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
40 645 650 655 

TTT GTG GTG TGC TTG CAA ATC CCT TTG AGG GTA GCG ATT GAA ATC AGC 4 80 

Phe Val Val Cys Leu Gin He Pro Leu Arg Val Ala He Glu He Ser 
660 665 670 

TCG CCT TCA AAG TAT TTC AGA ACC TTT AGC GAA GGG AGC ATG GTT ATG 52 8 

Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
675 680 685 

TAT TTT ATG ATT TCT ATC ATG CTC ACT TTA GTG TCG TTG CTT TTA TTT 576 
Tyr Phe Met He Ser He Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
690 695 700 

GTG AAA TGC ATT TCT AGC TTT TGG ACA GCG ATT GTT AAT TTT AGC AGT 624 
Val Lyo Cys He Ser Ser Phe Trp Thr Ala He Val Asn Phe Ser Ser 
705 710 715 
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TTT GAC ATT AAA GAA GTG TTC CAC CCC ATT GTG CTT TTA ACC CTA GCC 672 
Phe Asp lie Lys Glu Val Phe His Pro He Val Leu Leu Thr Leu Ala 
720 725 730 735 

TTA GCC ACC TTT GAT CTA GTC AAG GCG ATT TTT GAA GAG GAA GTT TTG 720 
Leu Ala Thr Phe Asp Leu Val Lys Ala He Phe Glu Glu Glu Val Leu 
740 745 750 

GGT AAA AAT AGC GGG GAC AAC CAC CAT GCG ATC CAC CGC ACG ATG ATC 768 
Gly Lys Asn Ser Gly Asp Asn His His Ala He His Arg Thr Met He 
755 760 765 

AGG TTT TTA GGC TCT ATC ATT ATC GCA TTA GCC ATT GAA GCG TTA ATG 816 
Arg Phe Leu Gly Ser He He He Ala Leu Ala He Glu Ala Leu Met 
770 775 780 

TTA GTG TTT AAA TTC AGC GTG AGC GAA CCG GAT AAA ATC ACT TAT GCG 864 
Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys He Thr Tyr Ala 
785 790 795 

TG TAT TTG GCT GTT GGC GTG GCG GTG CTT TTG ATC AGT TTG GCG ATT 912 
al Tyr Leu Ala Val Gly Val Ala Val Leu Leu He Ser Leu Ala He 
00 805 810 815 

TAT GTC AAA TTC GCC TAT AGC GTG TTG CCC AAA CGA GAA CGC TAA 957 
Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
820 825 830 



(2) ANGABEN ZU SEQ ID NO: 22: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 319 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 22: 

Met Leu Ser Arg Asp He Val Gin Tyr Ser Lys He Arg Thr Glu Leu 
1 5 10 15 

r Ala Tyr Leu Thr Tyr Leu Phe Ser His Asn He Arg Asn His Leu 
20 25 30 

ro Glu He Thr Leu Asp Tyr Leu Asn Lys Gin He Arg Lys Met His 
35 40 45 

Ala Glu He Lys Met Ala Lys Asn Phe Phe Val Leu Asp Ala Lvs Glv 
50 55 60 

Met Leu He Leu Lys Pro Ser Gin Leu Lys Glu Gin Gly His Lys Glu 
65 70 75 80 

Gly He Leu Glu His Asp Leu Thr Glu Gly He Glu Leu Glu Ser His 

85 90 95 

Ala Ser Phe Ser Asp Lys Tyr Tyr Phe Tyr Gin Ala Val Ser Glu Lys 
100 105 110 




Arg Cys He Leu Thr Asp Pro Tyr Pro Ser Lys Lys Gly Asn His Leu 
115 120 125 



Val Val Ser Ala Ser Tyr Pro Val Tyr Asp Gin Asn Asn Asp Leu Ala 
130 135 140 

Phe Val Val Cys Leu Gin lie Pro Leu Arg Val Ala lie Glu lie Ser 
14 5 150 155 160 

Ser Pro Ser Lys Tyr Phe Arg Thr Phe Ser Glu Gly Ser Met Val Met 
165 170 175 

Tyr Phe Met lie Ser lie Met Leu Thr Leu Val Ser Leu Leu Leu Phe 
180 185 190 

Val Lys Cys lie Ser Ser Phe Trp Thr Ala lie Val Asn Phe Ser Ser 
195 200 205 

Phe Asp lie Lys Glu Val Phe His Pro lie Val Leu Leu Thr Leu Ala 
210 215 220 
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Leu Ala Thr Phe Asp Leu Val Lys Ala lie Phe Glu Glu Glu Val Leu 
225 230 235 240 



ly Lys Asn Ser Gly Asp Asn His His Ala lie His Arg Thr Met lie 
245 250 255 



Arg Phe Leu Gly Ser lie lie lie Ala Leu Ala lie Glu Ala Leu Met 
260 265 270 

Leu Val Phe Lys Phe Ser Val Ser Glu Pro Asp Lys lie Thr Tyr Ala 
275 280 285 

Val Tyr Leu Ala Val Gly Val Ala Val Leu Leu lie Ser Leu Ala lie 
290 295 300 

Tyr Val Lys Phe Ala Tyr Ser Val Leu Pro Lys Arg Glu Arg * 
305 310 315 

(2) ANGABEN ZU SEQ ID NO: 23: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 480 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS083 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..480 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 23: 

ATG CAC TCT CCA AAT TTA GAA AAA GAA GAA ACC GAA ATC ATA GAA ACA 
Met His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu lie lie Glu Thr 
320 325 330 335 

CTC CTT ATG CGT GAA AAA ATG CGT TTA TGC CCC TTG TAT TGG CGC ATC 
Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Arg lie 




34 ° 345 350 

TTA GCG TTT TTA ACC GAT GGT TTG TTA GTG GCG TTT TTA TTG AGC GAT 
Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
355 360 365 

CTT TTA GAC GCA TGC GAT TTC TTG CAT TCT TTA TAT TGG CTA GCT AAC 
Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
370 375 380 

CCT ATT TAT CAC AGC GCA TTT GTT GCG ATG GGT TTT ATC ATC TTG TAT 
Pro He Tyr His Ser Ala Phe Val Ala Met Gly Phe He He Leu Tvr 
385 390 395 1 

GGC GTT TAT GAA ATC TTT TTT GTG TGT TTG TGC AAG ATG AGC TTG GCT 
Gly Val Tyr Glu He Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 
400 405 410 415 

AAA CTG GTT TTT AGG ATT AAG ATT ATT GAT ATT TAT TTG GCA GAT TGC 
Lys Leu Val Phe Arg He Lys He He Asp He Tyr Leu Ala Asp Cys 
420 425 430 

r ICC AGT AGG GCT ATT TTA TTG AAG CGT TTA GGG TTA AAG ATC GTG GTT 
Pro Ser Arg Ala lie Leu Leu Lys Arg Leu Gly Leu Lys He Val Val 
435 440 445 

TTT CTA TGC CCC TTT TTA TGG TTT GTT GCG TTT AAA AAC CCC TAT CAT 
Phe Leu Cys Pro Phe Leu Trp Phe Val Ala Phe Lys Asn Pro Tyr His 
450 455 460 

AGG GCG TGG CAT GAA GAA AAA AGC AAA AGT CTT TTG GTA TTG TTT TAA 
Arg Ala Trp His Glu Glu Lys Ser Lys Ser Leu Leu Val Leu Phe * 
465 470 475 




(2) ANGABEN ZU SEQ ID NO: 24: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE : 160 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 24 



let His Ser Pro Asn Leu Glu Lys Glu Glu Thr Glu He lie Glu Thr 
1 5 10 15 

Leu Leu Met Arg Glu Lys Met Arg Leu Cys Pro Leu Tyr Trp Aro He 
20 25 30 

Leu Ala Phe Leu Thr Asp Gly Leu Leu Val Ala Phe Leu Leu Ser Asp 
35 40 45 

Leu Leu Asp Ala Cys Asp Phe Leu His Ser Leu Tyr Trp Leu Ala Asn 
50 55 60 

Pro He Tyr His Ser Ala Phe Val Ala Met Gly Phe He He Leu Tvr 
65 70 75 80 

Gly Val Tyr Glu He Phe Phe Val Cys Leu Cys Lys Met Ser Leu Ala 

85 90 95 
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Lys Leu Val Phe Arg lie Lys lie 
100 

Pro Ser Arg Ala lie Leu Leu Lys 
115 120 

Phe Leu Cys Pro Phe Leu Trp Phe 
130 135 

Arg Ala Trp His Glu Glu Lys Ser 
145 150 



lie Asp lie Tyr Leu Ala Asp Cys 
105 no 

Arg Leu Gly Leu Lys lie Val Val 
125 

Val Ala Phe Lys Asn Pro Tyr His 
140 

Lys Ser Leu Leu Val Leu Phe * 
155 160 




(2) ANGABEN ZU SEQ ID NO: 25: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 1983 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTELBARE HERKUNFT: 
(B) CLON(E) : HPS084 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1983 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 25: 

ATG ATT TAT TGG TTG TAT TTG GCG GTC TTT TTT TTG TTG AGC GCA TTA 48 
Met lie Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
165 170 175 

GAC GCT AAA GAA ATC GCT ATG CAA CGA TTT GAC AAA CAA AAC CAT AAG 96 
Asp Ala Lys Glu lie Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
180 185 190 

ATT TTT GAA ATC CTT GCG GAT AAA GTG AGC GCT AAA GAC AAT GTG ATA 144 
~le Phe Glu lie Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val lie 
195 200 205 

GC GCA TCA GGG AAT GCG ATC TTA TTG AAT TAT GAT GTG TAT ATT CTA 192 
Thr Ala Ser Gly Asn Ala lie Leu Leu Asn Tyr Asp Val Tyr lie Leu 
210 215 220 

GCG GAC AAG GTG CGT TAT GAC ACT AAA ACC AAA GAA GCG TTA TTA GAG 24 0 

Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
225 230 235 240 

GGG AAT ATC AAG GTT TAT AGG GGC GAG GGT TTG CTC GTT AAA ACC GAT 2 88 

Gly Asn lie Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 
245 250 255 

TAC GTG AAA TTG AGT TTG AAT GAA AAA TAT GAA ATC ATT TTC CCC TTT 33 6 

Tyr Val Lye Leu Ser Leu Asn Glu Lys Tyr Glu lie lie Phe Pro Phe 
260 265 270 



TAT GTC CAA GAC AGC GTG AGC GGG ATT TGG GTG AGC GCG GAT ATT GCC 



384 




33 

Tyr Val Gin Asp Ser Val Ser Gly He Trp Val Ser Ala Asp He Ala 
275 280 285 

AGC GGA AAG GAT CAA AAA TAT AAG GTT AAA AAC ATG AGC ACT TCA GGG 432 
Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
290 295 300 

TGC AGC ATT GAT AAC CCC ATT TGG CAT GTC AAT GCG ACT TCA GGC TCA 4 80 

Cys Ser He Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
305 310 315 320 

TTC AAC ATG CAA AAA TCG CAT TTG TCT ATG TGG AAT CCT AAG ATC TAT 52 8 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
325 330 335 

GTC GGT GAT ATT CCT GTA TTG TAT TTG CCC TAT ATT TTC ATG TCC ACG 576 
Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
340 345 350 

AGC AAT AAA AGA ACT ACT GGG TTT TTA TAC CCT GAG TTT GGC ACT TCC 624 
'Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
355 360 365 

AAC TTA GAC GGC TTT ATT TAT TTG CAA CCC TTT TAT TTA GCC CCC AAA 672 
Asn Leu Asp Gly Phe He Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
370 375 380 

AAC TCA TGG GAT ATG ACC TTT ACC CCA CAA ATC CGC TAT AAA AGG GGT 72 0 

Asn Ser Trp Asp Met Thr Phe Thr Pro Gin He Arg Tyr Lys Arg Gly 
385 390 395 400 

TTT GGC TTG AAT TTT GAA GCG CGC TAC ATT AAC TCT AAA AAC GAC AGG 768 
Phe Gly Leu Asn Phe Glu Ala Arg Tyr He Asn Ser Lys Asn Asp Arg 
405 410 415 

TTT TTA TTC AAC GCG CGC TAT TTT AGG AAT TAC ACC CAA TAT GTC AAA 816 
Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
420 425 430 

CGC TAC GAT TTG AGG AAT CAA AAT ATC TAC GGG TTT GAA TTT TTA AGC 864 
Arg Tyr Asp Leu Arg Asn Gin Asn He Tyr Gly Phe Glu Phe Leu Ser 
435 440 445 

T AGC AGG GAC ACT TTA CAA AAA TAC TTC CAC CTT AAG TCT AAT ATT 912 
r Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn He 
450 455 460 

GAC AAC GGG CAT TAC ATT GAC TTT TTA TAC ATG AAC GAT TTG GAC TAT 960 
Asp Asn Gly His Tyr He Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
465 470 475 480 

GTG CGT TTT GAA AAG GTT AAT AAG CGT ATC ACA GAC GCC ACG CAC ATG 1008 
Val Arg Phe Glu Lys Val Asn Lys Arg He Thr Asp Ala Thr His Met 
485 490 495 

TCT AGG GCG AAT TAC TAT TTG CAA ACA GAA AAC AAT TAT TAC GGC TTG 1056 
Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
500 505 510 

AAT ATC AAG TAT TTT TTA AAC CTG AAT AAA ATC AAC AAT AAC CGC ACT 1104 
Asn He Lys Tyr Phe Leu Asn Leu Asn Lys He Asn Asn Asn Arg Thr 
515 520 525 
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TTC CAA TCT GTC CCT AAT TTG CAA TAC CAT AAA TAT TTA AAT TCT TTr 
Phe Gin Ser Val Pro Asn Leu Gin Tyr His •££ Tyr 2J JU sJr llu 

bJU 535 540 

TAT TTT AGA AAT TTG TTG TAT TCG GTG GAT TAT CAG TTT AGA AAC ACC 
Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
545 550 555 560 

GCA AGA GAG ATT GGT TAT GGC TAT GTG CAA AAC GCT TTG AAT GTG CCG 
Ala Arg Glu He Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
565 570 575 

GTG GGC TTG CAA TTT TCT TTG TTT AAA AAG TAT TTG TCT TTA GGG CTT 
Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
580 585 590 

TGG AAT GAT CTC CAA CTA TCT AAT GTG GCT TTA ATG CAA TCT AAA AAT 
Trp Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
59 5 600 605 

'CC TTC GTG CCT ACG ATC CCT AAT GAA TCA AGG GAA TTT GGG AAT TTT 
er Phe Val Pro Thr He Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
610 615 620 

GTG TCT TCA AAT TTT TCC ATG TAT GTC AAT ACG GAT TTG GCT AGA GAA 
Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
625 ^30 635 640 

TAC AAC AAG CTT TTC CAC ACG ATC CAA CTA GAA GCG ATT TTC AAC ATC 
Tyr Asn Lys Leu Phe His Thr He Gin Leu Glu Ala He Phe Asn He 
645 650 655 

CCT TAT TAC ACC TTT AAA AAC GGC TTA TTT TCT CAA AAC ATG TAT GCT 
Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
660 665 670 

TTA AGC GCG CAA GCC TTA AAC AGC TAC ACT TCG CCT TTA TTG AGA GAT 
Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arq Asd 
675 680 685 

TAT GAT TAT CAA GGG CGT TTG TAT GAC TCG GTG TGG AAT CCT AGC AGT 
Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
^ 690 695 700 



T TTA CCT AGC AAT GCG AGC AAC AAG ACG GTG GAT TTA ACC CTA ACG 
JLe Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
705 710 715 720 

CAA TAC CTT TAT GGC TTA GGG GGG CAA GAG TTA TTG TAT TTT AAA ATA 
Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys He 
7 25 730 735 

TCG CAA CTC ATC AAT CTT GAC GAT AAA GTT TCG CCC TTT AGA ATG CCA 
Ser Gin Leu He Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
740 745 750 

CTA GAG AGC AAG ATC GGG TTT TCG CCC TTA ACG GGA TTG AAC ATC TTT 
Leu Glu Ser Lys He Gly Phe Ser Pro Leu Thr Gly Leu Asn He Phe 
? 55 760 765 

GGG AAT GTC TTT TAT TCG TTT TAT CAA AAC CGC TTA GAA GAA ATC TCT 
Gly Ann Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu He Ser 



1152 



1200 



1248 



1296 



1344 



1392 



1440 



1488 



1536 



1584 



1632 



1680 



1728 



1776 



1824 



1872 
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770 775 

GTG AAC GCC AAT TAC CAA CGC AAG TTT 
Val Asn Ala Asn Tyr Gin Arg Lys Phe 
785 790 

TTT TTA AAA AAC AAT TTT AGC AGT GGG 
Phe Leu Lys Asn Asn Phe Ser Ser Gly 
805 

CTG CGG ATT ATT TAA 
Leu Arg He He * 
820 



780 

TTA AGC TTT AAC CTC TCT TAT 1920 
Leu Ser Phe Asn Leu Ser Tyr 
795 800 

ATT AAT AGC ATT GTA GAA AAT 1968 
He Asn Ser He Val Glu Asn 
810 815 

1983 



(2) ANGABEN ZU SEQ ID NO: 26: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 661 Aminos aur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 26: 

Met He Tyr Trp Leu Tyr Leu Ala Val Phe Phe Leu Leu Ser Ala Leu 
1 5 10 15 

Asp Ala Lys Glu He Ala Met Gin Arg Phe Asp Lys Gin Asn His Lys 
20 25 30 

He Phe Glu He Leu Ala Asp Lys Val Ser Ala Lys Asp Asn Val He 
35 40 45 

Thr Ala Ser Gly Asn Ala He Leu Leu Asn Tyr Asp Val Tyr He Leu 
50 55 60 

Ala Asp Lys Val Arg Tyr Asp Thr Lys Thr Lys Glu Ala Leu Leu Glu 
65 70 75 80 



Gly Asn He Lys Val Tyr Arg Gly Glu Gly Leu Leu Val Lys Thr Asp 

85 90 95 



r Val Lys Leu Ser Leu Asn Glu Lys Tyr Glu He He Phe Pro Phe 
100 105 110 

Tyr Val Gin Asp Ser Val Ser Gly He Trp Val Ser Ala Asp He Ala 
115 120 125 

Ser Gly Lys Asp Gin Lys Tyr Lys Val Lys Asn Met Ser Thr Ser Gly 
130 135 1 40 

Cys Ser He Asp Asn Pro He Trp His Val Asn Ala Thr Ser Gly Ser 
145 150 155 160 

Phe Asn Met Gin Lys Ser His Leu Ser Met Trp Asn Pro Lys He Tyr 
165 170 175 

Val Gly Asp He Pro Val Leu Tyr Leu Pro Tyr He Phe Met Ser Thr 
180 185 190 

Ser Asn Lys Arg Thr Thr Gly Phe Leu Tyr Pro Glu Phe Gly Thr Ser 
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195 200 205 

Asn Leu Asp Gly Phe lie Tyr Leu Gin Pro Phe Tyr Leu Ala Pro Lys 
210 215 220 

Asn Ser Trp Asp Met Thr Phe Thr Pro Gin lie Arg Tyr Lys Arg Gly 
225 230 235 240 

Phe Gly Leu Asn Phe Glu Ala Arg Tyr lie Asn Ser Lys Asn Asp Arg 
245 250 255 

Phe Leu Phe Asn Ala Arg Tyr Phe Arg Asn Tyr Thr Gin Tyr Val Lys 
260 265 270 

Arg Tyr Asp Leu Arg Asn Gin Asn lie Tyr Gly Phe Glu Phe Leu Ser 
275 280 285 

Ser Ser Arg Asp Thr Leu Gin Lys Tyr Phe His Leu Lys Ser Asn lie 
290 295 300 

sp Asn Gly His Tyr lie Asp Phe Leu Tyr Met Asn Asp Leu Asp Tyr 
05 310 315 320 

Val Arg Phe Glu Lys Val Asn Lys Arg lie Thr Asp Ala Thr His Met 
325 330 335 

Ser Arg Ala Asn Tyr Tyr Leu Gin Thr Glu Asn Asn Tyr Tyr Gly Leu 
340 345 350 

Asn lie Lys Tyr Phe Leu Asn Leu Asn Lys lie Asn Asn Asn Arg Thr 
355 360 365 

Phe Gin Ser Val Pro Asn Leu Gin Tyr His Lys Tyr Leu Asn Ser Leu 
370 375 380 

Tyr Phe Arg Asn Leu Leu Tyr Ser Val Asp Tyr Gin Phe Arg Asn Thr 
385 390 395 400 

Ala Arg Glu lie Gly Tyr Gly Tyr Val Gin Asn Ala Leu Asn Val Pro 
405 410 415 

Val Gly Leu Gin Phe Ser Leu Phe Lys Lys Tyr Leu Ser Leu Gly Leu 
420 425 430 



Asn Asp Leu Gin Leu Ser Asn Val Ala Leu Met Gin Ser Lys Asn 
435 440 445 



Ser Phe Val Pro Thr lie Pro Asn Glu Ser Arg Glu Phe Gly Asn Phe 
450 455 460 

Val Ser Ser Asn Phe Ser Met Tyr Val Asn Thr Asp Leu Ala Arg Glu 
465 470 475 480 

Tyr Asn Lys Leu Phe His Thr lie Gin Leu Glu Ala lie Phe Asn lie 
485 490 495 

Pro Tyr Tyr Thr Phe Lys Asn Gly Leu Phe Ser Gin Asn Met Tyr Ala 
500 505 510 

Leu Ser Ala Gin Ala Leu Asn Ser Tyr Thr Ser Pro Leu Leu Arg Asp 
515 520 525 
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Tyr Asp Tyr Gin Gly Arg Leu Tyr Asp Ser Val Trp Asn Pro Ser Ser 
530 535 540 

lie Leu Pro Ser Asn Ala Ser Asn Lys Thr Val Asp Leu Thr Leu Thr 
545 550 555 560 

Gin Tyr Leu Tyr Gly Leu Gly Gly Gin Glu Leu Leu Tyr Phe Lys lie 
565 570 575 

Ser Gin Leu lie Asn Leu Asp Asp Lys Val Ser Pro Phe Arg Met Pro 
580 585 590 

Leu Glu Ser Lys lie Gly Phe Ser Pro Leu Thr Gly Leu Asn lie Phe 
595 600 605 

Gly Asn Val Phe Tyr Ser Phe Tyr Gin Asn Arg Leu Glu Glu lie Ser 
610 615 620 

Val Asn Ala Asn Tyr Gin Arg Lys Phe Leu Ser Phe Asn Leu Ser Tyr 
625 630 635 640 

e Leu Lys Asn Asn Phe Ser Ser Gly lie Asn Ser lie Val Glu Asn 
645 650 655 

Leu Arg lie lie * 
660 

(2) ANGABEN ZU SEQ ID NO: 27: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 372 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPC085 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .372 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 27: 

ATG CGT TTG TTT ATC TCA CTA GTT TTG TTT TGG TGG TGG TTA AGT TTG 4 8 

Met Arg Leu Phe lie Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
665 670 675 

AAC GCT AAA GAA GCG GAT TTC ATC TCT GAT TTG GAA TAC GGG ATG GCT 96 
Asn Ala Lys Glu Ala Asp Phe lie Ser Asp Leu. Glu Tyr Gly Met Ala 
680 685 690 

CTT TAT AAA AAC CCT AGG GGT GTT GCG TGC GCG AAA TGC CAT GGC ATT 144 
Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly lie 
695 700 705 

AAA GGC GAA CAA CAA GAA ATC ACT TTT TAT TAT GAA AAA GGC GAA AAA 192 
Lys Gly Glu Gin Gin Glu lie Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
? 10 715 720 725 
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AAA ATC CTC TAC GCC CCT AAA ATC AAC CAT TTA GAT TTT AAA ACC TTT 
Lys He Leu Tyr Ala Pro Lys He Asn His Leu Asp Phe Lys Thr Phe 
730 735 740 

AAA GAC GCC CTG AGT TTA GGC AAA GGC ATG ATG CCT AAA TAC AAT CTC 
Lys Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 
745 750 755 

AAT TTA GAA GAA ATC CAA GCG ATT TAC CTT TAC ATC ACC TCT TTA GAG 
Asn Leu Glu Glu He Gin Ala lie Tyr Leu Tyr He Thr Ser Leu Glu 
760 765 770 

CAT AAA GAC GAG CAT AAG AAT CCT TCC AAG CCT TAA 
His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
775 780 785 




(2) ANGABEN ZU SEQ ID NO: 28: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 124 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 28: 

Met Arg Leu Phe He Ser Leu Val Leu Phe Trp Trp Trp Leu Ser Leu 
1 5 10 15 

Asn Ala Lys Glu Ala Asp Phe He Ser Asp Leu Glu Tyr Gly Met Ala 
20 25 30 

Leu Tyr Lys Asn Pro Arg Gly Val Ala Cys Ala Lys Cys His Gly He 
35 40 45 

Lys Gly Glu Gin Gin Glu He Thr Phe Tyr Tyr Glu Lys Gly Glu Lys 
50 55 60 



Lys He Leu Tyr Ala Pro Lys He Asn His Leu Asp Phe Lys Thr Phe 

65 70 75 80 

s Asp Ala Leu Ser Leu Gly Lys Gly Met Met Pro Lys Tyr Asn Leu 

85 90 95 



Asn Leu Glu Glu He Gin Ala He Tyr Leu Tyr He Thr Ser Leu Glu 
100 105 110 

His Lys Asp Glu His Lys Asn Pro Ser Lys Pro * 
115 120 

(2) ANGABEN ZU SEQ ID NO: 29: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 558 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
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<B) CLON(E) : HPC090 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..558 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 29: 



ATG CGT TGG TGG TGT TTT TTG GTG TGT TGT TTT GGT ATT TTA AGC GTG 4 8 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly He Leu Ser Val 
125 130 135 140 

ATG GAG GCT CAA AAA ACA GAC AAT AAA GGT TTG AAA AAA GAA AGA GAA 96 
Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
145 150 155 

CTT TTA GAA ATT ACT GGC AAC CAA TTT GTA GCG AAC GAC AAA ACC AAA 144 
Leu Leu Glu He Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 
160 165 170 

; CC GCC GTT ATT CAA GGC AAT GTG CAG ATC AAA AAA GGT AAA GAC CGG 192 
hr Ala Val He Gin Gly Asn Val Gin He Lys Lys Gly Lys Asp Arq 
175 180 185 

TTG TTT GCG GAT AAG GTG AGC GTG TTT TTA AAC GAT AAA CGA AAG CCA 24 0 

Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
190 195 200 

GAG CGC TAT GAA GCC ACA GGG AAC ACG CAT TTT AAC ATC TTT ACA GAG 288 
Glu Arg Tyr Glu Ala Thr Gly Asn Thr His Phe Asn He Phe Thr Glu 
205 210 215 220 

GAC AAT CGT GAA ATC AGC GGG AGC GCT GAC AAG CTC ATT TAT AAC GCA 336 
Asp Asn Arg Glu He Ser Gly Ser Ala Asp Lys Leu He Tyr Asn Ala 
225 230 235 

TTG AAT GGG GAA TAC AAA TTA TTG CAA AAT GCG GTG GTT AGA GAA GTG 3 84 

Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
240 245 250 

GGG AAA TCT AAT GTC ATC ACT GGC GAT GAA ATC ATT TTA AAC AAA ACT 432 
■ciy Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
1 255 260 265 



,G GGT TAT GCT GAT GTG TTA GGG AGC GCG AAA CGG CCC GCT AAA TTC 
Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
270 275 280 
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GTG TTT GAT ATG GAA GAT ATT AAT GAA GAA AAT CGT AAG GCT AAA TTG 52 8 

Val Phe Asp Met Glu Asp He Asn Glu Glu Asn Arg Lys Ala Lys Leu 
285 290 295 300 

AAG AAG AAA GGC ACT AAG GAA AAA CCA TGA 558 
Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
305 310 

(2) ANGABEN ZU SEQ ID NO: 30: 

( i ) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 186 Aminosauren 




(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 30: 

Met Arg Trp Trp Cys Phe Leu Val Cys Cys Phe Gly He Leu Ser Val 
1 5 10 15 

Met Asp Ala Gin Lys Thr Asp Asn Lys Gly Leu Lys Lys Glu Arg Glu 
20 25 30 

Leu Leu Glu He Thr Gly Asn Gin Phe Val Ala Asn Asp Lys Thr Lys 
35 40 45 

Thr Ala Val He Gin Gly Asn Val Gin He Lys Lys Gly Lys Asp Ara 
50 55 60 

Leu Phe Ala Asp Lys Val Ser Val Phe Leu Asn Asp Lys Arg Lys Pro 
65 70 75 80 

lu Arg Tyr Glu Ala Thr Gly Asn Thr His Phe Asn He Phe Thr Glu 
85 90 95 

Asp Asn Arg Glu He Ser Gly Ser Ala Asp Lys Leu He Tyr Asn Ala 
100 105 110 

Leu Asn Gly Glu Tyr Lys Leu Leu Gin Asn Ala Val Val Arg Glu Val 
H5 120 125 

Gly Lys Ser Asn Val He Thr Gly Asp Glu He He Leu Asn Lys Thr 
130 135 140 

Lys Gly Tyr Ala Asp Val Leu Gly Ser Ala Lys Arg Pro Ala Lys Phe 
145 150 155 160 

Val Phe Asp Met Glu Asp He Asn Glu Glu Asn Arg Lys Ala Lys Leu 
165 170 175 

Lys Lys Lys Gly Thr Lys Glu Lys Pro * 
180 185 



) ANGABEN ZU SEQ ID NO: 31: 



( i ) S EQUENZ KENNZE ICHEN : 

(A) LANGE: 768 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS104 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .768 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 31: 




ATG GAT ATT TAT GCG TTA TAT ATA GCG ATA GGG CTT TTT ACT GGC ATT 
Met Asp lie Tyr Ala Leu Tyr lie Ala He Gly Leu Phe Thr Gly He 
190 195 200 

CTA TCA GGG ATT TTT GGC ATT GGT GGG GGG TTG ATC ATT GTC CCT ATC 
Leu Ser Gly He Phe Gly He Gly Gly Gly Leu He He Val Pro He 
205 210 215 

ATG CTC GGA ACC GGG CAT TCT TTT GAA GAA TCC ATT GGG ATT TCC ATT 
Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser He Gly He Ser He 
220 225 230 

TTG CAA ATG GCG CTT TCA TCG TTC GTG GGC TCT GTT TTG AAT TTC AAA 
Leu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
235 240 245 250 

AAA AAA TCG CTT GAT TTT TCT TTA GGC TTG TTG ATA GGG GCA GGG GGG 
Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Glv 
255 260 265 

:TG ATA GGG GCG AGT TTT AGC GGA TTT GTT TTA AAA ATC GTT TCC AGT 
ieu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
270 275 280 

AAA ATT TTA ATG GTT ATT TTC GCG CTT TTA GTC GTG TAT TCT ATG ATC 
Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
285 290 295 

CAA TTT GTT TTG AAA CCC AAA AAA AAA GAT TTG ATA GCG GAT ACT AAA 
Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
300 305 310 

CGC TAT CAT CTG CAA GGT TTG AAA TTA TTT TTA ATT GGC ACG CTC ACA 
Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
315 320 325 330 

OGG TTT TTT GCT ATC ACT TTA GGG ATT GGT GGG GGG ATG CTC ATG GTG 
Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
335 340 345 

CCT TTG ATG CAT TAT TTT TTA GGG TAT GAT TCT AAA AAA TGC GTG GCT 
Pro Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
^ 350 355 360 



r A GGG TTA TTT TTC ATC TTG TTT TCT TCT ATT TCA GGA GCT TTT TCT 
■eu Gly Leu Phe Phe He Leu Phe Ser Ser He Ser Gly Ala Phe Ser 
365 370 375 

TTA ATG TAT CAC CAC ATC ATC AAT AAA GAA GTG CTC TTA GCA GGG GCG 
Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
380 385 390 

ATT GTG GGA TTA GGA TCT GTT ATG GGC GTG AGC ATT GGG ATT AAA TGG 
lie Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trr> 
395 400 405 410 

ATC ATG GGG CTT TTG AAT GAA AAA ATG CAT AAA GCT TTG ATT TTA GGG 
He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
415 420 425 

GTG TAT GGT TTG TCG CTA TTG ATT GTT TTA TAC AAA CTC TTT TTT TAA 
Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
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430 435 440 

(2) ANGABEN ZU SEQ ID NO: 32: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 256 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKHLS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 32: 

Met Asp lie Tyr Ala Leu Tyr lie Ala lie Gly Leu Phe Thr Gly lie 
15 10 15 

Leu Ser Gly lie Phe Gly lie Gly Gly Gly Leu lie lie Val Pro lie 
20 25 30 

Met Leu Ala Thr Gly His Ser Phe Glu Glu Ser lie Gly lie Ser lie 
35 40 45 

eu Gin Met Ala Leu Ser Ser Phe Val Gly Ser Val Leu Asn Phe Lys 
50 55 60 

Lys Lys Ser Leu Asp Phe Ser Leu Gly Leu Leu He Gly Ala Gly Gly 
65 70 75 80 

Leu He Gly Ala Ser Phe Ser Gly Phe Val Leu Lys He Val Ser Ser 
85 90 95 

Lys He Leu Met Val He Phe Ala Leu Leu Val Val Tyr Ser Met He 
100 105 110 

Gin Phe Val Leu Lys Pro Lys Lys Lys Asp Leu He Ala Asp Thr Lys 
115 120 125 

Arg Tyr His Leu Gin Gly Leu Lys Leu Phe Leu He Gly Thr Leu Thr 
130 135 140 

Gly Phe Phe Ala He Thr Leu Gly He Gly Gly Gly Met Leu Met Val 
145 ISO 155 160 

o Leu Met His Tyr Phe Leu Gly Tyr Asp Ser Lys Lys Cys Val Ala 
165 170 175 

Leu Gly Leu Phe Phe He Leu Phe Ser Ser He Ser Gly Ala Phe Ser 
180 185 190 

Leu Met Tyr His His He He Asn Lys Glu Val Leu Leu Ala Gly Ala 
195 200 205 

He Val Gly Leu Gly Ser Val Met Gly Val Ser He Gly He Lys Trp 
210 215 220 

He Met Gly Leu Leu Asn Glu Lys Met His Lys Ala Leu He Leu Gly 
225 230 235 240 

Val Tyr Gly Leu Ser Leu Leu He Val Leu Tyr Lys Leu Phe Phe * 
245 250 255 
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(2) ANGABEN ZU SEQ ID NO: 33: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 2367 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS115 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1. .2367 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 33: 

TG AAA TGT TCG CAT TGC CAG TTG GAG TTT AAA GAA AGT GAG CTT TTT 4 8 

et Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
260 265 270 

AAA GAG GTG ATC AAT CAT AAA GAA TTG CAT TTT TGC TGC ACG GGG TGC 96 
Lys Glu Val lie Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
275 280 285 

GCT AGG GTG TAT GCG TTA TTG TTA GAT TTG AAT TTA GAG AGC TTT TAT 144 
Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
290 295 300 

GAC AAA TTA AAC GAT TCC ACT TTA GCC CCC GTA ACG CCC CAA GAT TCA 192 
Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
305 310 315 320 

ATG AGC GCT TTG GAA TTA GAA CAA GCC CTT GAA GAA AAC AAT AAG GGC 240 
Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
325 330 335 

GAT TTT ATC CTT AAT CTT TTG TTA GAA AAA ACG CAT TGT AAC GCT TGC 288 
Asp Phe lie Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 
340 345 350 

G TGG CTC AAT CAA AAG GTT TTA GAA CGT TTA AGT GGG GTT AAA AAA 336 
L,eu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
355 360 365 

GTG AGC GTG AAT TTC ACC ACC CAC CAC TTG CAA ATC GTG TTT GAG AAG 384 
Val Ser Val Asn Phe Thr Thr His His Leu Gin He Val Phe Glu Lys 
370 375 380 

TCC TTA AAC CCT AAA GAG ATT ATT CAA AAA ATT GAG AGT TTG GGC TAT 4 32 

Ser Leu Asn Pro Lys Glu He He Gin Lys He Glu Ser Leu Gly Tyr 
385 390 395 400 

GGG GCT AAA ATT TAT AAT GCG CAA AAT TAC ACC CTA AAA GCG CAA AAA 4 80 

Gly Ala Lys He Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
405 410 415 



GAA CAG CGC TCC TAC TTG CTC ACT TTG AGC GTG GGG TTT TTT GCC ACT 
Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 



528 
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420 425 430 

ATG AAT TTG ATG TTT ATC GCC ATT GCC AAA TAC GCA AGT TAT GGT GGC 576 
Met Asn Leu Met Phe He Ala He Ala Lys Tyr Ala Ser Tyr Glv Glv 
435 440 445 

GCA AGT TAT GGC GGT GCG AAT TAT GGC GCT GGC ATG GAT AAG CTT ATG 624 
Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
450 455 460 

CAA AGG AAT TTG GAT CTC GTA TCG CTC TTT TTA AGC TTG TTG GTG TTA 672 
Gin Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
465 470 475 480 

GTG GTT GTG GGG CGT TTT TTC ATT AAG GGG GCG TTT TAT GGG CTA AAA 720 
Val Val Val Gly Arg Phe Phe He Lys Gly Ala Phe Tyr Gly Leu Lys 
485 490 495 

AAT GGC GTT TTG GGC ATG GAT TTG AGC GTG TCT TTT GGA GCG TTA TCG 768 
Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
k 500 505 510 

CG TTT GTT TAT TCC GTT TAT GCC ATG TTG GTG TCC CAA GAG ACT TAT 816 
Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
515 520 525 

TTT GAA GCG AGC AGC ACG ATT CTA ACG CTT GTT TTT GGC TCT AAG TTT 864 
Phe Glu Ala Ser Ser Thr He Leu Thr Leu Val Phe Gly Ser Lys Phe 
530 535 540 

TTG GAA TTA AAA GCC AGG CTG TTT GCG AAT GAA AAA TGT CTG GCC CTA 912 
Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
545 550 555 560 

GAA TCG CAT GAA ATC CAT AGC GTG ATC GTT GTA GAA AAT GGC AAG CAA 960 
Glu Ser His Glu He His Ser Val He Val Val Glu Asn Gly Lys Gin 
565 570 575 

ACA GAA AAA CAC CCT AAA GAT GTG GCG ATA GGC TCT GTT GTT TGG GTG 1008 
Thr Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp Val 
580 585 590 

!A AGC GGG GCT AAA ATC GCA CTA GAT GGC GTG CTT TTA AAT AAT GCG 1056 
o Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
595 600 605 

AGC GTG GAT GCG TCT TTG ATC AGT GGG GAG TTT AAG CCT TTG GAA TTG 1104 
Ser Val Asp Ala Ser Leu He Ser Gly Glu Phe Lys Pro Leu Glu Leu 
610 615 620 

GGG GTT AAT GAT CCA ATT TTA GGG GGT TAT GTG AAT GTG GGC GTG CCT 1152 
Gly Val Asn Asp Pro He Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
625 630 635 640 

TTT AGC TAT CAA GTG AGC GCT AAT TTT CAA AAC TCA CGC CTT TCT GGT 1200 
Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
645 650 655 

TTG TTA GAA ACT TTA AAA AAG AGT TTT TTA GAA AAG CCC TTA ATT GAG 124 8 

Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu He Glu 
660 665 670 



45 





1392 



1440 



AGT AGC GCG AAT CAA ATT GCG GAT ATT TTT TCT AAA GCG GTG TTG TTT 1296 
Ser Ser Ala Asn Gin He Ala Asp He Phe Ser Lys Ala Val Leu Phe 
675 680 685 

TTA GCC TTT GTA AGC TTT TTG TTA TGG CAA TTT GGT TTG GGG GGT AAT 1344 
Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
690 695 700 

TTT GAA AAA GCC TTA ATG GTG TGT ATT AGC GTG CTA GTC ATC AGC TGC 
Phe Glu Lys Ala Leu Met Val Cys He Ser Val Leu Val He Ser Cys 
705 "10 715 720 

CCT TGC GCG TTC GCT CTG GCT ACG CCC ATT GCG TTA GTG ATA GGG GTG 
Pro Cys Ala Phe Ala Leu Ala Thr Pro He Ala Leu Val He Gly Val 
725 730 735 

TTT AAA AAC CCT TTG ATC GTG TTT AAA GAA GCG TTG TTT TTA GAA ACT 14 8 8 

Phe Lys Asn Pro Leu He Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
740 745 750 

TG GCT AAA GTG AAA AAA ATC TTT ATA GAC AAA ACC GGC ACG CTC ACG 1536 
|eu Ala Lys Val Lys Lys He Phe He Asp Lys Thr Gly Thr Leu Thr 
755 760 765 

CAA AAA GAA GTC CTT TTA AAA GAA AAA ATC ATT TAT GAA GAA TTT GAT 1584 
Gin Lys Glu Val Leu Leu Lys Glu Lys He He Tyr Glu Glu Phe Asp 
770 775 780 

GGA AGG CTT TTG AAG AGC CTT TTA AAA GTG AGA GAG CAT TTA GCC CAT 1632 
Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
785 790 795 800 

AGC GCG ATT CTT AAA TCT CTA GAT GGC GAT GAG GTT AGT TTA GAA AAG 1680 
Ser Ala He Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
805 810 815 

ATA GAG TTT TTC GCT CAT GGT CTG AAA GCG AGC TAT CAA AAC GAA ACC 172 8 

He Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
820 825 830 

CTG CTA GTG GGG AGT TTG AAA TTT TTG GGA TCT ATG GGG GTG GAT ATA 1776 
Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp He 
835 840 845 

!A ATG AAA GAG AGC GCT AAT ATC ATG GTA GGC TTT GCG AAA AAT GAG 1824 
xo Met Lys Glu Ser Ala Asn He Met Val Gly Phe Ala Lys Asn Glu 
850 855 860 

ACT TTA TGC GCG TTA TTC ATT TTA GAA GAG CGT TTG AAA GCT AAC GCT 1872 
Thr Leu Cys Ala Leu Phe He Leu Glu Glu Arg Leu Lys Ala Asn Ala 
865 870 875 880 

AAA GAA GTC GTT CAG GCT TTA CAA AAT AAA GGC TTA GAA TTA GAG ATT 192 0 

Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
885 890 895 

TTA AGC GGG GAT AAT GAA AGC TCG GTT AAG GAG TGC GCG AAA AAA TTA 1968 
Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
900 905 910 

GGG ATT TCT AAT TAT CAT GCC CAT TTG ACC CCT GAA GAT AAG GCT CAA 2016 
Gly He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
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915 920 925 

ACC ATC AGC TCT TAT AAG GGC GTT TGC GCG ATG GTA GGC GAT GGC AAT 2064 
Thr lie Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
930 935 940 

AAT GAT GCG TTA GCC TTA AAA CAA GCG AGC GTT TCT TTA GGG TTT GAA 2112 
Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
94 5 950 955 960 

AAA AGC GCT TTG AGT AAA AGC GCA TGC GAT ATT TTG CTT TTA GAA GAG 2160 
Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp lie Leu Leu Leu Glu Glu 
965 970 975 

GAT TTG AGT TTG CTA AAA AAA GCG TTT GAT AAC GCT CAA AAA GTC TAT 2208 
Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
980 985 990 

CAA GTG GTG TTG CAA AAC ATT GTT TTG AGC TTG ATT TAT AAC GCT ATT 2256 
Gin Val Val Leu Gin Asn He Val Leu Ser Leu He Tyr Asn Ala He 
995 1000 1005 

TA ATC CCG GTC GCT ATG CTA GGA TAC ATT AAC CCT TTA ATA GCG AGT 23 04 

Leu He Pro Val Ala Met Leu Gly Tyr He Asn Pro Leu He Ala Ser 
1010 1015 1020 

TTG AGC ATG AGC GCT AGC TCA CTC TTA GTG GTC TTA AAT TCT TTG AGG 2352 
Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
1°25 1030 1035 1040 

TTG AAA CGC TCT TAA 2367 
Leu Lys Arg Ser * 

1045 



(2) ANGABEN ZU SEQ ID NO: 34: 

(i) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 789 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 



• 



(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 34: 



et Lys Cys Ser His Cys Gin Leu Glu Phe Lys Glu Ser Glu Leu Phe 
1 5 10 15 

Lys Glu Val He Asn His Lys Glu Leu His Phe Cys Cys Thr Gly Cys 
20 25 30 

Ala Arg Val Tyr Ala Leu Leu Leu Asp Leu Asn Leu Glu Ser Phe Tyr 
35 40 45 

Asp Lys Leu Asn Asp Ser Thr Leu Ala Pro Val Thr Pro Gin Asp Ser 
50 55 60 

Met Ser Ala Leu Glu Leu Glu Gin Ala Leu Glu Glu Asn Asn Lys Gly 
65 70 75 80 

Asp Phe He Leu Asn Leu Leu Leu Glu Lys Thr His Cys Asn Ala Cys 

85 90 95 



— Pr< 
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Leu Trp Leu Asn Gin Lys Val Leu Glu Arg Leu Ser Gly Val Lys Lys 
100 105 110 

Val Ser Val Asn Phe Thr Thr His His Leu Gin He Val Phe Glu Lys 
115 120 125 

Ser Leu Asn Pro Lys Glu He He Gin Lys He Glu Ser Leu Glv Tvr 
130 135 140 

Gly Ala Lys He Tyr Asn Ala Gin Asn Tyr Thr Leu Lys Ala Gin Lys 
145 150 155 160 

Glu Gin Arg Ser Tyr Leu Leu Thr Leu Ser Val Gly Phe Phe Ala Thr 
165 170 175 

Met Asn Leu Met Phe He Ala He Ala Lys Tyr Ala Ser Tyr Gly Gly 
180 185 190 

Ala Ser Tyr Gly Gly Ala Asn Tyr Gly Ala Gly Met Asp Lys Leu Met 
195 200 205 

In Arg Asn Leu Asp Leu Val Ser Leu Phe Leu Ser Leu Leu Val Leu 
210 215 220 

Val Val Val Gly Arg Phe Phe He Lys Gly Ala Phe Tyr Gly Leu Lys 
225 230 235 240 

Asn Gly Val Leu Gly Met Asp Leu Ser Val Ser Phe Gly Ala Leu Ser 
245 250 255 

Ala Phe Val Tyr Ser Val Tyr Ala Met Leu Val Ser Gin Glu Thr Tyr 
260 265 270 

Phe Glu Ala Ser Ser Thr He Leu Thr Leu Val Phe Gly Ser Lys Phe 
275 280 285 

Leu Glu Leu Lys Ala Arg Leu Phe Ala Asn Glu Lys Cys Leu Ala Leu 
2^0 295 300 

Glu Ser His Glu He His Ser Val He Val Val Glu Asn Gly Lys Gin 
305 310 315 320 

r Glu Lys His Pro Lys Asp Val Ala He Gly Ser Val Val Trp Val 
325 330 335 

■ro Ser Gly Ala Lys He Ala Leu Asp Gly Val Leu Leu Asn Asn Ala 
340 345 350 

Ser Val Asp Ala Ser Leu He Ser Gly Glu Phe Lys Pro Leu Glu Leu 
355 360 365 

Gly Val Asn Asp Pro He Leu Gly Gly Tyr Val Asn Val Gly Val Pro 
370 375 330 

Phe Ser Tyr Gin Val Ser Ala Asn Phe Gin Asn Ser Arg Leu Ser Gly 
385 390 395 400 

Leu Leu Glu Thr Leu Lys Lys Ser Phe Leu Glu Lys Pro Leu lie Glu 
405 410 415 

Ser Ser Ala Asn Gin He Ala Asp He Phe Ser Lys Ala Val Leu Phe 
420 425 430 
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Leu Ala Phe Val Ser Phe Leu Leu Trp Gin Phe Gly Leu Gly Gly Asn 
435 440 445 

Phe Glu Lys Ala Leu Met Val Cys lie Ser Val Leu Val lie Ser Cys 
450 455 460 

Pro Cys Ala Phe Ala Leu Ala Thr Pro lie Ala Leu Val lie Gly Val 
465 470 475 480 

Phe Lys Asn Pro Leu He Val Phe Lys Glu Ala Leu Phe Leu Glu Thr 
485 490 495 

Leu Ala Lys Val Lys Lys He Phe He Asp Lys Thr Gly Thr Leu Thr 
500 505 510 

Gin Lys Glu Val Leu Leu Lys Glu Lys He He Tyr Glu Glu Phe Asp 
515 520 525 

Gly Arg Leu Leu Lys Ser Leu Leu Lys Val Arg Glu His Leu Ala His 
530 535 540 

r Ala He Leu Lys Ser Leu Asp Gly Asp Glu Val Ser Leu Glu Lys 
45 550 555 560 

He Glu Phe Phe Ala His Gly Leu Lys Ala Ser Tyr Gin Asn Glu Thr 
565 570 575 

Leu Leu Val Gly Ser Leu Lys Phe Leu Gly Ser Met Gly Val Asp He 
580 585 590 

Pro Met Lys Glu Ser Ala Asn He Met Val Gly Phe Ala Lys Asn Glu 
595 600 605 

Thr Leu Cys Ala Leu Phe He Leu Glu Glu Arg Leu Lys Ala Asn Ala 
610 615 620 




Lys Glu Val Val Gin Ala Leu Gin Asn Lys Gly Leu Glu Leu Glu He 
625 630 635 640 

Leu Ser Gly Asp Asn Glu Ser Ser Val Lys Glu Cys Ala Lys Lys Leu 
645 650 655 

y He Ser Asn Tyr His Ala His Leu Thr Pro Glu Asp Lys Ala Gin 
660 665 670 

r He Ser Ser Tyr Lys Gly Val Cys Ala Met Val Gly Asp Gly Asn 
675 680 685 



Asn Asp Ala Leu Ala Leu Lys Gin Ala Ser Val Ser Leu Gly Phe Glu 
690 695 700 

Lys Ser Ala Leu Ser Lys Ser Ala Cys Asp He Leu Leu Leu Glu Glu 
705 710 715 720 

Asp Leu Ser Leu Leu Lys Lys Ala Phe Asp Asn Ala Gin Lys Val Tyr 
725 730 735 

Gin Val Val Leu Gin Asn He Val Leu Ser Leu He Tyr Asn Ala He 
740 745 750 



Leu He Pro Val Ala Met Leu Gly Tyr He Asn Pro Leu He Ala Ser 
755 760 765 
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Leu Ser Met Ser Ala Ser Ser Leu Leu Val Val Leu Asn Ser Leu Arg 
770 775 780 

Leu Lys Arg Ser * 
785 

(2) ANGABEN ZU SEQ ID NO: 35: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 2751 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS120 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..2751 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 35: 

ATT AAA AAA TTA ATT CTA TCC TCT CTT GTT TTC GCA TGT ATC AAT ACC 48 
lie Lys Lys Leu lie Leu Ser Ser Leu Val Phe Ala Cys lie Asn Thr 
790 795 800 805 

AGC GTT GAA GCT TTA GAA AAT GAC GGC TCT AAA CCA AAC GAT TTG ACT 96 
Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
810 815 820 

TCT CCA AAA GAA GCC TCT CAA GAA TCT CAA AAA AAT GAA GCT CCA AAA 144 
Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
825 830 835 

AAT GAA GTT CAA AGA AAT GAA GCT CAA AAA GAA ACC CCC CAA TCC AAT 192 
Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
840 845 850 



ACG CCT AAA GAA ATG AAA GTC AAG TCC ATT TCT TAT GTC GGG CTT 24 0 

Thr Pro Lys Glu Met Lys Val Lys Ser lie Ser Tyr Val Gly Leu 
855 860 865 



TCT TAC ATG TCT GAC ATG CTC GCT AAT GAA ATT GTA AAG ATT CGT GTG 28 8 

Ser Tyr Met Ser Asp Met Leu Ala Asn Glu lie Val Lys lie Arg Val 
870 875 880 885 

GGC GAT ATT GTG GAT TCT AAA AAA ATA GAC ACC GCT GTT TTG GCT TTG 33 6 

Gly Asp lie Val Asp Ser Lys Lys He Asp Thr Ala Val Leu Ala Leu 
890 895 900 

TTC AAT CAA GGG TAT TTT AAA GAC GTT TAT GCC ACT TTT GAA GGC GGC 3 84 

Phe Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
905 910 915 

ATA TTA GAG TTT CAT TTT GAT GAA AAA GCC AGG ATT GCC GGG GTA GAA 4 32 

He Leu Glu Phe His Phe Asp Glu Lys Ala Arg He Ala Gly Val Glu 
920 925 930 
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ATC AAG GGT TAT GGG ACT GAA AAG GAA AAA GAC GGC TTA AAA TCC CAA 480 
He Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
935 940 945 

ATG GGG ATC AAA AAG GGC GAC ACC TTT GAT GAG CAA AAA TTA GAG CAT 52 8 

Met Gly He Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
950 955 960 965 

GCT AAA ACG GCT TTA AAA ACC GCT TTA GAG GGG CAG GGC TAT TAT GGG 576 
Ala Lys Thr Ala Leu Lys Thr Ala Leu Glu Gly Gin Gly Tyr Tyr Gly 
970 975 980 

AGC GTG GTG GAG GTG CGC ACA GAA AAG GTC AGT GAG GGT GCA TTA TTG 624 
Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
985 990 995 

ATC GTG TTT GAT GTG AAT AGG GGG GAT AGC ATT TAT ATC AAA CAA TCC 672 
He Val Phe Asp Val Asn Arg Gly Asp Ser He Tyr He Lys Gin Ser 
1000 1005 1010 

TT TAT QAG QGA AQC GCQ g ^ XCT TTG 720 

le Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met He Glu Ser Leu 
1015 1020 1025 

AGT GCG AAC AAG CAA CGA GAT TTC ATG GGC TGG ATG TGG GGC TTG AAT 768 
Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
1030 1035 1040 1045 

GAC GGG AAA TTG CGT TTA GAT CAA CTA GAA TAC GAT TCT ATG CGT ATC 816 
Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg He 
1050 1055 1060 

CAA GAT GTG TAT ATG CGT AGG GGT TAC TTA GAC GCT CAT ATT TCT TCG 864 
Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His He Ser Ser 
1065 1070 1075 

CCT TTT TTG AAA ACG GAT TTT TCT ACC CAT GAC GCT AAG CTT CAT TAT 912 
Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
1080 1085 1090 

AAA GTC AAA GAG GGG ATC CAA TAC AGG ATT TCA GAC ATT TTA ATA GAG 960 
Lys Val Lys Glu Gly He Gin Tyr Arg He Ser Asp He Leu He Glu 
1095 1100 1105 

'T GAC AAC CCG GTA GTC CCC TTA AAA ACC TTA GAA AAA GCG CTT AAA 10 08 

e Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
1110 1115 1120 1125 

GTG AAA AGG AAA GAT GTC TTT AAT ATT GAG CAT TTA AGA GCG GAT GCG 1056 
Val Lys Arg Lys Asp Val Phe Asn He Glu His Leu Arg Ala Asp Ala 
H30 1135 1140 

CAA ATT TTA AAA ACC GAA ATC GCC GAT AAG GGT TAT GCG TTT GCG GTG HQ* 
Gin He Leu Lys Thr Glu He Ala Asp Lys Gly Tyr Ala Phe Ala Val 
1145 1150 1155 

GTG AAG CCA GAC TTG GAT AAA GAT GAA AAA AAC GGG CTT GTG AAA GTC 1152 
Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
H60 1165 1170 

ATT TAT CGT ATT GAA GTG GGC GAT ATG GTG TAT ATC AAT GAT GTC ATC 1200 
He Tyr Arg He Glu Val Gly Asp Met Val Tyr He Asn Asp Val He 
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1175 1180 1185 

ATT TCA GGG AAC CAG CGC ACG AGC GAT AGG ATC ATT AGA AGG GAG TTA 1248 
lie Ser Gly Asn Gin Arg Thr Ser Asp Arg He He Arg Arg Glu Leu 
1190 1195 1200 1205 

TTG TTA GGG CCT AAG GAT AAA TAC AAC TTG ACC AAA CTG AGA AAT TCC 1296 
Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
1210 1215 1220 

GAA AAT TCT TTA AGG CGT TTA GGA TTC TTC TCT AAA GTC AAA ATT GAA 1344 
Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys lie Glu 
1225 1230 1235 

GAA AAA AGG GTT AAT AGC TCA CTC ATG GAT TTA TTA GTG AGC GTA GAA 13 92 

Glu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
1240 1245 1250 

GAG GGG CGT ACT GGG CAG TTG CAA TTT GGG TTA GGC TAT GGC TCT TAT 1440 
Glu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
k 1255 1260 1265 



IA GGG CTT ATG CTT AAT GGG AGC GTG AGC GAA AGA AAC CTT TTT GGC 14 88 

Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
1270 1275 1280 1285 

ACA GGG CAA AGC ATG AGC TTG TAT GCT AAC ATC GCT ACA GGG GGG GGT 153 6 

Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn He Ala Thr Gly Gly Gly 
1290 1295 1300 

AGA TCT TAT CCG GGC ATG CCA AAA GGA GCG GGG CGT ATG TTT GCC GGG 1584 
Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala Gly Arg Met Phe Ala Gly 
1305 1310 1315 

AAT TTG AGC TTG ACT AAT CCA AGG ATT TTT GAC AGC TGG TAT AGC TCT 1632 
Asn Leu Ser Leu Thr Asn Pro Arg He Phe Asp Ser Trp Tyr Ser Ser 
1320 1325 1330 

ACG ATC AAC CTT TAT GCG GAT TAC AGG ATA AGC TAC CAA TAC ATC CAA 1680 
Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
1335 1340 1345 

GGC GGG GGC TTT GGG GTG AAT GTC GGG CGC ATG CTG GGT AAT AGA 1728 



n Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arq 
50 1355 1360 1365 

ACC CAT GTG AGC TTA GGG TAT AAC TTG AAT GTT ACC AAA CTC CTT GGT 1776 
Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
1370 1375 1380 

TTC AGC AGC CCT TTA TAC AAC CGC TAC TAT TCC TCT GTT AAT GAA GTG 1824 
Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
1385 1390 1395 

GTT TCT CCA AGG CAA TGT TCT ACC CCC GCA TCG GTG ATT ATC AAT CGC 1872 
Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val He He Asn Arq 
1400 1405 1410 

TTA TCA GGC GGT AAA ACC CCC TTA CAA CCT GAA AGC TGT TCT AGT CCT 1920 
Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
1415 1420 1425 
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GGA GCG ATC ACC ACT TCA CCA GAA ATA AGA GGT ATT TGG GAT AGG GAT 1968 
Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
14 30 1435 1440 1445 

TAC CAT ACG CCT ATC ACC AGC TCT TTC ACC CTT GAT GTG AGC TAT GAC 2016 
Tyr His Thr Pro He Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
1450 1455 1460 

AAC ACC GAT GAT TAT TAC TTC CCT AGA AAT GGG GTT ATC TTT AGT TCC 2 064 

Asn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val He Phe Ser Ser 
1465 1470 1475 

TAT GCG ACG ATG TCT GGC TTG CCA AGC TCT GGC ACG CTC AAT TCT TGG 2112 
Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
1480 1485 1490 

AAC GGG TTA GGC GGG AAT GTC CGT AAC ACC AAA GTT TAT GGT AAA TTC 2160 
Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
1495 1500 1505 

CC GCT TAC CAC CAT TTG CAA AAA TAT TTA TTG ATA GAT TTG ATC GCT 22 0 8 

la Ala Tyr His His Leu Gin Lys Tyr Leu Leu He Asp Leu He Ala 
510 1515 1520 1525 

CGC TTT AAA ACG CAA GGA GGT TAT ATC TTT AGG TAT AAC ACC GAT GAT 2256 
Arg Phe Lys Thr Gin Gly Gly Tyr He Phe Arg Tyr Asn Thr Asp Asp 
1530 1535 1540 

TAC TTG CCC TTA AAC TCC ACC TTC TAC ATG GGG GGC GTA ACC ACG GTG 23 04 

Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
1545 1550 1555 

AGA GGC TTT AGG AAC GGA TCG GTT ACT CCT AAA GAT GAG TTT GGC TTG 2352 
Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
1560 1565 1570 

TGG CTT GGA GGC GAT GGG ATT TTT ACC GCT TCT ACT GAA TTG AGC TAT 2400 
Trp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
1575 1580 1585 

GGG GTG CTA AAG GCG GCT AAA ATG CGC TTA GCG TGG TTT TTT GAC TTT 2448 
Gly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 
AC90 1595 1600 1605 

T TTC TTA ACC TTT AAA ACC CCA ACT AGA GGG AGT TTT TTC TAT AAC 24 96 

ly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 
1610 1615 1620 

GCT CCT GTT ACG ACA GCG AAT TTT AAA GAT TAT GGC GTT ATA GGG GCT 2544 
Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 
1625 1630 1635 

GGG TTT GAA AGA GCG ACT TGG AGG GCT TCC ACA GGC TTG CAG ATT GAA 25 92 

Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
1640 1645 1650 

TGG ATT TCG CCC ATG GGG CCT TTG GTG TTG ATT TTC CCT ATA GCG TTT 264 0 

Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 
1655 1660 1665 

TTC AAC CAA TGG GGC GAT GGC AAT GGC AAG AAA TGT AAA GGG CTA TGC 268 8 

Phe Asn Gin Trp Gly Aop Gly Asn Gly Lye Lys Cys Lys Gly Leu Cys 





le Leu Glu Phe His Phe Asp Glu Lys Ala Arg lie Ala Gly Val Glu 
130 135 140 

He Lys Gly Tyr Gly Thr Glu Lys Glu Lys Asp Gly Leu Lys Ser Gin 
145 150 155 160 

Met Gly He Lys Lys Gly Asp Thr Phe Asp Glu Gin Lys Leu Glu His 
165 170 175 

Ala Lys Thr Ala Leu Lys Thr Ala Leu GluSGly Gin Gly Tyr Tyr Gly 
180 185 190 

Ser Val Val Glu Val Arg Thr Glu Lys Val Ser Glu Gly Ala Leu Leu 
155 200 205 

He Val Phe Asp Val Asn Arg Gly Asp Ser He Tyr He Lys Gin Ser 
210 215 220 



2751 
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I 670 1675 1680 1685 

TTC AAC CCT AAC ATG GAC GAT TAC ACG CAA CAC TTT GAA TTT TCT ATG 2736 
Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
1690 1695 1700 

GGA ACA AGG TTT TAA 
Gly Thr Arg Phe * 
1705 

(2) ANGABEN ZU SEQ ID NO: 36: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 917 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 36: 

le Lys Lys Leu He Leu Ser Ser Leu Val Phe Ala Cys He Asn Thr 
1 5 10 15 

Ser Val Glu Ala Leu Glu Asn Asp Gly Ser Lys Pro Asn Asp Leu Thr 
20 25 30 

Ser Pro Lys Glu Ala Ser Gin Glu Ser Gin Lys Asn Glu Ala Pro Lys 
35 40 45 

Asn Glu Val Gin Arg Asn Glu Ala Gin Lys Glu Thr Pro Gin Ser Asn 
50 55 60 

Gin Thr Pro Lys Glu Met Lys Val Lys Ser He Ser Tyr Val Gly Leu 
65 70 75 80 

Ser Tyr Met Ser Asp Met Leu Ala Asn Glu He Val Lys He Arg Val 

85 90 95 

Gly Asp He Val Asp Ser Lys Lys He Asp Thr Ala Val Leu Ala Leu 
100 105 110 

:e Asn Gin Gly Tyr Phe Lys Asp Val Tyr Ala Thr Phe Glu Gly Gly 
115 120 125 
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lie Tyr Glu Gly Ser Ala Lys Leu Lys Arg Arg Met lie Glu Ser Leu 
225 230 235 240 

Ser Ala Asn Lys Gin Arg Asp Phe Met Gly Trp Met Trp Gly Leu Asn 
245 250 255 

Asp Gly Lys Leu Arg Leu Asp Gin Leu Glu Tyr Asp Ser Met Arg lie 
260 265 270 

Gin Asp Val Tyr Met Arg Arg Gly Tyr Leu Asp Ala His He Ser Ser 
275 280 285 

Pro Phe Leu Lys Thr Asp Phe Ser Thr His Asp Ala Lys Leu His Tyr 
290 295 300 

Lys Val Lys Glu Gly He Gin Tyr Arg He Ser Asp lie Leu He Glu 
305 310 315 320 

He Asp Asn Pro Val Val Pro Leu Lys Thr Leu Glu Lys Ala Leu Lys 
325 330 335 

al Lys Arg Lys Asp Val Phe Asn He Glu His Leu Arg Ala Asp Ala 
340 345 350 

Gin He Leu Lys Thr Glu He Ala Asp Lys Gly Tyr Ala Phe Ala Val 
355 360 365 




Val Lys Pro Asp Leu Asp Lys Asp Glu Lys Asn Gly Leu Val Lys Val 
370 375 380 

He Tyr Arg He Glu Val Gly Asp Met Val Tyr He Asn Asp Val He 
385 390 395 400 

He Ser Gly Asn Gin Arg Thr Ser Asp Arg He He Arg Arg Glu Leu 
405 410 415 

Leu Leu Gly Pro Lys Asp Lys Tyr Asn Leu Thr Lys Leu Arg Asn Ser 
420 425 430 

Glu Asn Ser Leu Arg Arg Leu Gly Phe Phe Ser Lys Val Lys He Glu 
435 440 445 

lu Lys Arg Val Asn Ser Ser Leu Met Asp Leu Leu Val Ser Val Glu 
450 455 460 

lu Gly Arg Thr Gly Gin Leu Gin Phe Gly Leu Gly Tyr Gly Ser Tyr 
465 470 475 480 

Gly Gly Leu Met Leu Asn Gly Ser Val Ser Glu Arg Asn Leu Phe Gly 
485 490 495 

Thr Gly Gin Ser Met Ser Leu Tyr Ala Asn He Ala Thr Gly Gly Gly 
500 505 510 

Arg Ser Tyr Pro Gly Met Pro Lys Gly Ala»Gly Arg Met Phe Ala Gly 
515 520 525 

Asn Leu Ser Leu Thr Asn Pro Arg He Phe Asp Ser Trp Tyr Ser Ser 
530 535 540 

Thr He Asn Leu Tyr Ala Asp Tyr Arg He Ser Tyr Gin Tyr He Gin 
545 550 555 560 
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Gin Gly Gly Gly Phe Gly Val Asn Val Gly Arg Met Leu Gly Asn Arg 
565 570 575 

Thr His Val Ser Leu Gly Tyr Asn Leu Asn Val Thr Lys Leu Leu Gly 
580 585 590 

Phe Ser Ser Pro Leu Tyr Asn Arg Tyr Tyr Ser Ser Val Asn Glu Val 
595 600 605 

Val Ser Pro Arg Gin Cys Ser Thr Pro Ala Ser Val lie lie Asn Arg 
610 615 620 

Leu Ser Gly Gly Lys Thr Pro Leu Gin Pro Glu Ser Cys Ser Ser Pro 
625 630 635 640 

Gly Ala lie Thr Thr Ser Pro Glu lie Arg Gly lie Trp Asp Arg Asp 
645 650 655 

Tyr His Thr Pro lie Thr Ser Ser Phe Thr Leu Asp Val Ser Tyr Asp 
660 665 670 

sn Thr Asp Asp Tyr Tyr Phe Pro Arg Asn Gly Val He Phe Ser Ser 
675 680 685 

Tyr Ala Thr Met Ser Gly Leu Pro Ser Ser Gly Thr Leu Asn Ser Trp 
690 695 700 

Asn Gly Leu Gly Gly Asn Val Arg Asn Thr Lys Val Tyr Gly Lys Phe 
705 710 715 720 

Ala Ala Tyr His His Leu Gin Lys Tyr Leu Leu He Asp Leu He Ala 
725 730 735 

Arg Phe Lys Thr Gin Gly Gly Tyr He Phe Arg Tyr Asn Thr Asp Asp 
740 745 750 

Tyr Leu Pro Leu Asn Ser Thr Phe Tyr Met Gly Gly Val Thr Thr Val 
755 760 765 

Arg Gly Phe Arg Asn Gly Ser Val Thr Pro Lys Asp Glu Phe Gly Leu 
770 775 780 



rp Leu Gly Gly Asp Gly He Phe Thr Ala Ser Thr Glu Leu Ser Tyr 
5 790 795 800 



ly Val Leu Lys Ala Ala Lys Met Arg Leu Ala Trp Phe Phe Asp Phe 

805 810 815 

Gly Phe Leu Thr Phe Lys Thr Pro Thr Arg Gly Ser Phe Phe Tyr Asn 

820 825 830 

Ala Pro Val Thr Thr Ala Asn Phe Lys Asp Tyr Gly Val He Gly Ala 

835 840 845 

Gly Phe Glu Arg Ala Thr Trp Arg Ala Ser Thr Gly Leu Gin He Glu 
850 855 860 

Trp He Ser Pro Met Gly Pro Leu Val Leu He Phe Pro He Ala Phe 

865 870 875 880 

Phe Acn Gin Trp Gly Asp Gly Asn Gly Lys Lys Cys Lys Gly Leu Cys 

885 890 895 
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Phe Asn Pro Asn Met Asp Asp Tyr Thr Gin His Phe Glu Phe Ser Met 
900 905 910 

Gly Thr Arg Phe * 
915 

(2) ANGABEN ZU SEQ ID NO: 37: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS130 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 37: 

ATG AAA AGA TTT GTT TTG TTT TTA TTG TTC ATG TGC GTT TGC GTT CAA 4 8 

Met Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
920 925 930 

GCT TAC GCC GAG CAA GAT TAC TTT TTT AGG GAT TTT AAA TCT AGA GAT 96 
Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
935 940 945 

TTG CCC CAA AAA CTC CAT CTT GAT AAA AAG CTC TCC CAA ACA ATA CAG 144 
Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
950 955 960 965 

CCA TGC ATG CAA CTT AAC GCA TCA AAA CAC TAC ACT TCT ACC GGG GTT 192 
Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 
970 975 980 

fA GAG CCT GAT AAA TGC ACA AAG AGT TTT AAA AAA TCC GCT CTC ATG 240 
:g Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
985 990 995 

TCC TAT GAC TTA GCG CTA GGT TAT TTG GTG AGT AAG AAT AAG CAA TAC 288 
Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
1000 1005 1010 

GGC TTA AAG GCT ATA GAA ATT TTA AAC GCT TGG GCT AAA GAG CTT CAA 33 6 

Gly Leu Lys Ala lie Glu lie Leu Asn Ala Tro Ala Lvs Glu Leu Gin 
1015 1020 ' 1025 

AGC GTG GAT ACT TAT CAG AGC GAG GAT AAT ATC AAT TTT TAC ATG CCT 3 84 

Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn He Asn Phe Tyr Met Pro 
1030 1035 1040 1045 

TAT ATG AAC ATG GCT TAT TGG TTT GTC AAA AAG GCG TTT CCT AGC CCA 432 
Tyr Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
1050 1055 1060 




57 



• 



GAA TAT GAA GAT TTC ATT AAG CGG ATG CGC CAG TAT TCT CAA TCA GCT 480 
Glu Tyr Glu Asp Phe lie Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
1065 1070 1075 

CTT AAC ACT AAC CAT GGG GCG TGG GGC ATT CTT TTT GAT GTG AGT TCT 52 8 

Leu Asn Thr Asn His Gly Ala Trp Gly He Leu Phe Asp Val Ser Ser 
1080 1085 1090 

GCG CTA GCG TTA GAC GAT AAT GCC CTT TTG CAC AAT AGC GCT AAT CGG 576 
Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Ara 
1095 1100 1105 

TGG CAG GAG TGG GTG TTT AAA GCC ATA GAT GAG AAT GGG GTT ATT GCT 624 
Trp Gin Glu Trp Val Phe Lys Ala He Asp Glu Asn Gly Val He Ala 
1110 1115 1120 1125 

AGC GCG ATC ACT AGG AGC GAT ACG AGC GAT TAT CAT GGC GGC CCT ACA 672 
Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
1130 1135 1140 

X3 GGC ATT AAG GGG ATA GCT TAT ACC AAT TTC GCG CTT CTT GCG CTA 720 
\ys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
1145 1150 1155 

ACC ATA TCA GGC GAA TTG CTT TTT GAG AAC GGG TAT GAT TTG TGG GGT 768 
Thr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
1160 1165 1170 

AGT GGA GCT GGG AAA AGG CTC TCT GTG GCG TAT AAC AAA GTT GCA ACA 816 
Ser Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
1175 1180 1185 

TGG ATT TTA AAC CCT GAA ACT TTC CCT TAT TTC CAG CCT AAC CTT ATC 864 
Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu He 
1190 1195 1200 1205 

GGG GTG CAT AAC AAC GCC TAT TTC ATT ATT TTA GCC AAG CAT TAT TCT 912 
Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
1210 12X5 1220 

AGC CCT AGT GCA AAT GAG CTT TTA AAG CAA GGC GAT TTA CAC GAA GAT 960 
Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
^ 1225 1230 1235 



tT TTC AGG CTG XGA 
ly Phe Arg Leu Lys Leu Arg Ser Pro * 
1240 1245 
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(2) ANGABEN ZU SEQ ID NO: 38: 

( i ) SEQUENZKENNZE I CHEN : 

(A) LANGE: 330 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 38: 

■let Lys Arg Phe Val Leu Phe Leu Leu Phe Met Cys Val Cys Val Gin 
1 5 10 15 
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Ala Tyr Ala Glu Gin Asp Tyr Phe Phe Arg Asp Phe Lys Ser Arg Asp 
20 25 30 

Leu Pro Gin Lys Leu His Leu Asp Lys Lys Leu Ser Gin Thr lie Gin 
35 40 45 

Pro Cys Met Gin Leu Asn Ala Ser Lys His Tyr Thr Ser Thr Gly Val 
50 55 60 

Arg Glu Pro Asp Lys Cys Thr Lys Ser Phe Lys Lys Ser Ala Leu Met 
65 70 75 80 

Ser Tyr Asp Leu Ala Leu Gly Tyr Leu Val Ser Lys Asn Lys Gin Tyr 
85 90 95 

Gly Leu Lys Ala lie Glu lie Leu Asn Ala Trp Ala Lys Glu Leu Gin 
100 105 110 

Ser Val Asp Thr Tyr Gin Ser Glu Asp Asn lie Asn Phe Tyr Met Pro 
115 120 125 

x Met Asn Met Ala Tyr Trp Phe Val Lys Lys Ala Phe Pro Ser Pro 
130 135 140 

Glu Tyr Glu Asp Phe He Lys Arg Met Arg Gin Tyr Ser Gin Ser Ala 
145 150 155 160 

Leu Asn Thr Asn His Gly Ala Trp Gly He Leu Phe Asp Val Ser Ser 
165 170 175 

Ala Leu Ala Leu Asp Asp Asn Ala Leu Leu His Asn Ser Ala Asn Arg 
180 185 190 

Trp Gin Glu Trp Val Phe Lys Ala He Asp Glu Asn Gly Val He Ala 
195 200 205 

Ser Ala He Thr Arg Ser Asp Thr Ser Asp Tyr His Gly Gly Pro Thr 
210 215 220 

Lys Gly He Lys Gly He Ala Tyr Thr Asn Phe Ala Leu Leu Ala Leu 
225 230 235 240 

*hr He Ser Gly Glu Leu Leu Phe Glu Asn Gly Tyr Asp Leu Trp Gly 
k 245 250 255 

r Gly Ala Gly Lys Arg Leu Ser Val Ala Tyr Asn Lys Val Ala Thr 
260 265 270 

Trp He Leu Asn Pro Glu Thr Phe Pro Tyr Phe Gin Pro Asn Leu He 
275 280 285 

Gly Val His Asn Asn Ala Tyr Phe He He Leu Ala Lys His Tyr Ser 
290 295 300 

Ser Pro Ser Ala Asn Glu Leu Leu Lys Gin Gly Asp Leu His Glu Asp 
305 310 315 320 

Gly Phe Arg Leu Lys Leu Arg Ser Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 39: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 14 82 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS133 

( ix) MERKMAL : 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .1482 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 39: 

ATG CAA AGT CTT AGT TGG CTG AAT TTA GCG TTT CGT TGG CTC TTT ATA 48 
Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe He 
K 335 340 345 

.CA GGG CTT GGC TAT TAT ATA ATG ACT TTA TTG CAA TGG TAT CAT TAC 96 
Thr Gly Leu Gly Tyr Tyr He Met Thr Leu Leu Gin Trp Tyr His Tyr 
35 0 355 360 

AGC GTG TTT AGG ATC TTA ACC AAG CAC CAC AAA ATG CGT TGG CAT GGG 144 
Ser Val Phe Arg He Leu Thr Lys His His Lys Met Arg Trp His Gly 
365 370 375 

ATT TAT TTT TTA TTG CCT TTA GGG GTG TTT ATT CTG TCG TAT GCT TTC 192 
He Tyr Phe Leu Leu Pro Leu Gly Val Phe He Leu Ser Tyr Ala Phe 
380 385 390 

ACA ATG CCG TTT GTT TTT GAT TTC TTT TGC GGC GTT ATT CAA ATG CCC 24 0 

Thr Met Pro Phe Val Phe Asp Phe Phe Cys Gly Val He Gin Met Pro 
-* 95 400 405 410 

ATG CTC ATT GTT TGG GCC AAA CGC AAC GAC AAG CCT TTA GTT TTC ACG 288 
Met Leu He Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 
415 420 425 

A AGG GTG AAG CGC TTT TTT ATC TTC TTA TTA TTA TTT TTA ATC TTG 336 
>p Arg Val Lys Arg Phe Phe He Phe Leu Leu Leu Phe Leu He Leu 
4 30 435 440 

CAT GAA ATC TTA AAT ATA GAA TTA GTC CCT TTG GAT GGG ATT TCG CTC 3 84 

His Glu He Leu Asn He Glu Leu Val Pro Leu Asp Gly He Ser Leu 
445 450 455 

GCG CTA GGC TAT TTG TGT TTG TTT ATA TTC GTT TTA AGC GCT TCT TTA 4 32 

Ala Leu Gly Tyr Leu Cys Leu Phe He Phe Val Leu Ser Ala Ser Leu 
460 465 470 

ATC TCT GAA AAA GCC TTA TCC AAG CAG TAT TTG CAA ACC GCT AAA GAT 4 80 

lie Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
475 480 485 490 

AAA ATC ACC TCT TTA AAG AAT TTA AAA GTC ATC GCC ATT ACC GGA AGC 52 8 

Lys He Thr Ser Leu Lys Asn Leu Lys Val He Ala He Thr Gly Ser 
495 500 505 
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TTT GGG AAA ACC AGC ACC AAA AAT TTC TTG CTT CAA ATC TTA CAA ACC 576 
Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin lie Leu Gin Thr 
510 515 520 

ACA TTC AAC GCG CAT GCA AGC CCC AAA AGC GTC AAT ACC CTT TTA GGG 624 
Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
525 530 535 

CTT GCG AAT GAT ATT AAT CAG AAT TTA GAC GAT AGG AGT GAA ATC TAT 672 
Leu Ala Asn Asp lie Asn Gin Asn Leu Asp Asp Arg Ser Glu lie Tyr 
540 545 550 

ATC GCT GAA GCC GGG GCA AGG AAT AAG GGC GAT ATT AAA GAA ATC ACC 720 
lie Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp lie Lys Glu lie Thr 
555 560 565 570 

TGT CTC ATT GAA CCG CAC CTT GTT GTG GTT GCA GAA GTG GGC GAA CAG 768 
Cys Leu lie Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
575 580 585 



T TTA GAA TAC TTT AAA ACT TTA GAA AAT ATT TGC GAG ACT AAA GCG 816 
is Leu Glu Tyr Phe Lys Thr Leu Glu Asn lie Cys Glu Thr Lys Ala 
590 595 600 



GAA TTA TTG GAT TCC AAA CGC TTA GAA AAA GCC TTT TGT TAC TCG GTG 864 
Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
605 610 615 

GAA AAG ATC AAG CCC TAT GCC CCT AAA GAT AGC CCT TTA ATA GAC TAT 912 
Glu Lys lie Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu lie Asp Tyr 
620 625 630 

TCT AGC CTG GTT AAA AAC ATC CAA TCC ACT TTA AAA GGC ACT TCT TTT 960 
Ser Ser Leu Val Lys Asn lie Gin Ser Thr Leu Lys Gly Thr Ser Phe 
635 640 645 650 

GAA ATG CTT ATA GGT AGC GTT TGG GAA AGA TTT GAA ACA AAG GTT CTA 1008 
Glu Met Leu lie Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
655 660 665 



GGG GAG TTT AGC GCT TAT AAT ATC GCT TCA GCC ATT TTA ATC GCT AAG 1056 
Gly Glu Phe Ser Ala Tyr Asn lie Ala Ser Ala He Leu He Ala Lys 
670 675 680 



KT TTA GGC TTA GAG ACC GAA AGG ATC AAA CGG CTT GTT TTA GAA CTC 1104 
is Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
685 690 695 

AAC CCT ATT GCT CAT CGT TTG CAA CTT TTG GAA GTG AAT CAA AAA ATC 1152 
Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
700 705 710 

ATC ATA GAC GAT AGC TTT AAT GGG AAT TTA AAG GGC ATG TTA GAG GGC 12 00 

He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
715 720 725 730 

ATT CGT TTA GCG AGT TTG CAC AAA GGG CGT AAA GTC ATT GTA ACA CCG 124 8 

He Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
735 740 745 

GGC TTA GTG GAA AGC AAT ACA GAA AGT AAT GAG GCT TTA GCG CAA AAA 12 9 6 

Gly Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
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750 755 760 

ATA GAC GGG GTT TTT GAT GTC GCT ATC ATC ACA GGG GAG TTG AAT TCC 1344 
He Asp Gly Val Phe Asp Val Ala He He Thr Gly Glu Leu Asn Ser 
765 770 775 

AAA ACG ATT GCT TCA CAA TTG AAA ACC CCC CAA AAA ATC TTA CTC AAG 13 92 

Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 
780 785 790 

GAT AAG GCG CAA TTG GAA AAT ATC TTA CAA GCC ACC ACG ATT CAA GGC 1440 
Asp Lys Ala Gin Leu Glu Asn He Leu Gin Ala Thr Thr He Gin Gly 
79 5 800 805 810 

GAT TTG ATT TTA TTC GCT AAT GAC GCC CCT AAT TAC ATT TAG 1482 
Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr He * 
815 820 

(2) ANGABEN ZU SEQ ID NO: 40: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 494 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 40: 

Met Gin Ser Leu Ser Trp Leu Asn Leu Ala Phe Arg Trp Leu Phe He 
1 5 10 15 

Thr Gly Leu Gly Tyr Tyr He Met Thr Leu Leu Gin Trp Tyr His Tyr 
20 25 30 

Ser Val Phe Arg He Leu Thr Lys His His Lys Met Arg Trp His Gly 
35 40 45 

He Tyr Phe Leu Leu Pro Leu Gly Val Phe He Leu Ser Tyr Ala Phe 
50 55 60 

__ T hr Me t Pro Phe Val Phe Asp Phe Phe Cys Gly Val He Gin Met Pro 
S^^t 5 70 75 80 



t Leu He Val Trp Ala Lys Arg Asn Asp Lys Pro Leu Val Phe Thr 
85 90 95 

Pro Arg Val Lys Arg Phe Phe He Phe Leu Leu Leu Phe Leu He Leu 
100 105 110 

His Glu He Leu Asn He Glu Leu Val Pro Leu Asp Gly He Ser Leu 
H5 120 125 

Ala Leu Gly Tyr Leu Cys Leu Phe He Phe Val Leu Ser Ala Ser Leu 
!30 135 140 

He Ser Glu Lys Ala Leu Ser Lys Gin Tyr Leu Gin Thr Ala Lys Asp 
145 150 155 160 

Lys He Thr Ser Leu Lys Asn Leu Lys Val He Ala He Thr Gly Ser 
165 170 175 
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Phe Gly Lys Thr Ser Thr Lys Asn Phe Leu Leu Gin lie Leu Gin Thr 
180 185 190 

Thr Phe Asn Ala His Ala Ser Pro Lys Ser Val Asn Thr Leu Leu Gly 
195 200 205 

Leu Ala Asn Asp lie Asn Gin Asn Leu Asp Asp Arg Ser Glu lie Tyr 
210 215 220 

lie Ala Glu Ala Gly Ala Arg Asn Lys Gly Asp He Lys Glu He Thr 
225 230 235 240 

Cys Leu lie Glu Pro His Leu Val Val Val Ala Glu Val Gly Glu Gin 
245 250 255 

His Leu Glu Tyr Phe Lys Thr Leu Glu Asn He Cys Glu Thr Lys Ala 
260 265 270 

Glu Leu Leu Asp Ser Lys Arg Leu Glu Lys Ala Phe Cys Tyr Ser Val 
275 280 285 

lu Lys He Lys Pro Tyr Ala Pro Lys Asp Ser Pro Leu He Asp Tyr 
290 295 300 

Ser Ser Leu Val Lys Asn He Gin Ser Thr Leu Lys Gly Thr Ser Phe 
305 310 315 320 

Glu Met Leu He Gly Ser Val Trp Glu Arg Phe Glu Thr Lys Val Leu 
325 330 335 

Gly Glu Phe Ser Ala Tyr Asn He Ala Ser Ala He Leu He Ala Lys 
340 345 350 

His Leu Gly Leu Glu Thr Glu Arg He Lys Arg Leu Val Leu Glu Leu 
355 360 365 

Asn Pro He Ala His Arg Leu Gin Leu Leu Glu Val Asn Gin Lys He 
370 375 380 



He He Asp Asp Ser Phe Asn Gly Asn Leu Lys Gly Met Leu Glu Gly 
385 390 395 400 



e Arg Leu Ala Ser Leu His Lys Gly Arg Lys Val He Val Thr Pro 
405 410 415 



ly Leu Val Glu Ser Asn Thr Glu Ser Asn Glu Ala Leu Ala Gin Lys 
420 425 430 

He Asp Gly Val Phe Asp Val Ala He He Thr Gly Glu Leu Asn Ser 
435 440 445 

Lys Thr He Ala Ser Gin Leu Lys Thr Pro Gin Lys He Leu Leu Lys 
4 50 455 460 

Asp Lys Ala Gin Leu Glu Asn He Leu Gin Ala Thr Thr He Gin Gly 
465 470 475 480 

Asp Leu He Leu Phe Ala Asn Asp Ala Pro Asn Tyr He * 
485 490 

(2) ANGABEN ZU SEQ ID NO: 41: 
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(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 600 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPC134 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..600 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 41: 

ATG TCA AGC GCT CTG TTA GGC TTA CAA ATT GTT TTA GCG GTA TTG ATT 48 
Met Ser Ser Ala Leu Leu Gly Leu Gin He Val Leu Ala Val Leu He 
95 500 505 510 

TG GTG GTG GTT TTG TTG CAA AAA AGT TCT AGC ATC GGC TTA GGG ACT 96 
Val Val Val Val Leu Leu Gin Lys Ser Ser Ser He Gly Leu Gly Thr 
515 520 525 

TAT AGC GGG AGT AAT GAG TCT TTA TTT GGC GCT AAA GGG CCC GCG TGC 144 
Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
530 535 540 

TTT ATG GCG AAA TTG ACC ATG TTT TTA GGG CTG TTA TTT GTT ATC AAC 192 
Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val He Asn 
545 550 555 

ACC ATC GCT TTG GGC TAT TTT TAC AAC AAA GAA TAC GGC AAA AGC ATT 240 
Thr He Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser He 
560 565 570 

TTA GAT GAA ACT AAA ACC AAC AAA GAG CTT TCG CCC TTA GTC CCT GCC 2 88 

Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
575 580 585 590 



CC GGC ACG CTC AAC CCT ACA CTC AAT CCC ACG CTC AAC CCT ACG CTC 336 
r Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
595 600 605 



AAC CCT TTA GAG CAA GCC CCA ACT AAT CCT TTA ATG CCA AAA CAA ACG 3 84 

Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
610 615 620 

CCT AAC GAA CTC CCT AAA GAG CCA GCC AAA GCG CCT TCT GTT GAA AGC 432 
Pro Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
625 630 635 

CCC AAA CAG AAT GAA AAA AAT GAA AAA AAT GAC GCC AAA GAG AAT GGT 4 80 

Pro Lyo Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys. Glu Asn Gly 
640 645 650 

ATA AAG GGT GTT GAA AAA ACT AAA GAG AAC GCC AAA ACG CCC CCA ACC 528 
He Lyo Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
65 5 660 665 670 
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ACC CAC CAA AAG CCT AAA ACG CAT GCG ACA CAA ACC AAC GCC CAT ACC 576 
Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
675 680 685 

AAC CAA AAA AAG GAT GAA AAA TAA 600 
Asn Gin Lys Lys Asp Glu Lys * 
690 



(2) ANGABEN ZU SEQ ID NO: 42: 

{ i) SEQUENZKENNZEICHEN: 

(A) LANGE: 200 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 42; 



Met Ser Ser Ala Leu Leu Gly Leu Gin lie Val Leu Ala Val Leu lie 
15 10 15 



al Val Val Val Leu Leu Gin Lys Ser Ser Ser lie Gly Leu Gly Thr 
20 25 30 

Tyr Ser Gly Ser Asn Glu Ser Leu Phe Gly Ala Lys Gly Pro Ala Cys 
35 40 45 

Phe Met Ala Lys Leu Thr Met Phe Leu Gly Leu Leu Phe Val lie Asn 
50 55 60 

Thr lie Ala Leu Gly Tyr Phe Tyr Asn Lys Glu Tyr Gly Lys Ser lie 
65 70 75 80 

Leu Asp Glu Thr Lys Thr Asn Lys Glu Leu Ser Pro Leu Val Pro Ala 
85 90 95 

Thr Gly Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu Asn Pro Thr Leu 
100 105 110 

Asn Pro Leu Glu Gin Ala Pro Thr Asn Pro Leu Met Pro Lys Gin Thr 
115 120 125 

o Asn Glu Leu Pro Lys Glu Pro Ala Lys Ala Pro Ser Val Glu Ser 
130 135 140 

Pro Lys Gin Asn Glu Lys Asn Glu Lys Asn Asp Ala Lys Glu Asn Gly 
145 150 155 160 

lie Lys Gly Val Glu Lys Thr Lys Glu Asn Ala Lys Thr Pro Pro Thr 
165 170 175 

Thr His Gin Lys Pro Lys Thr His Ala Thr Gin Thr Asn Ala His Thr 
180 185 190 

Asn Gin Lys Lys Asp Glu Lys * 
195 200 

(2) ANGABEN ZU SEQ ID NO : 43: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1536 Basenpaare 
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(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS143 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1536 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 43: 

ATG AAA AAA CTT CTT TAT ACC ATA CTC GCG CTT CTT TTA ATC GGC CTT 4 8 

Met Lys Lys Leu Leu Tyr Thr lie Leu Ala Leu Leu Leu lie Gly Leu 
205 210 215 



JTA ACA ATC TAT CTC ATC CTT TTT ACA GAA TGG GGG AAT AAG ATC ATC 96 
eu Thr lie Tyr Leu lie Leu Phe Thr Glu Trp Gly Asn Lys lie lie 
220 225 230 




GCT TCG TAT ATA GAG AAA AAA ATC AAC CCG AAC GAG CAC TAC TTG AGC 144 
Ala Ser Tyr lie Glu Lys Lys lie Asn Pro Asn Glu His Tyr Leu Ser 
235 240 245 

GTT AAA ACC TTT AAA TTG AGA TTC AAC TCT TTG GAT TTT AAA GCT CAA 192 
Val Lys Thr Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
250 255 260 

GCC AAC GAT GAT TCC ACG CTC ATT CTT AAG GGG GAT TTT TCA CTT TTA 240 
Ala Asn Asp Asp Ser Thr Leu lie Leu Lys Gly Asp Phe Ser Leu Leu 
265 270 275 280 

AAG CAA AGC GTA AAT TTG AAT TAC CAT ATA GAT ATT AAA GAT TTA CGC 288 
Lys Gin Ser Val Asn Leu Asn Tyr His lie Asp lie Lys Asp Leu Arg 
285 290 295 

TCT TTC AAA GAA TGG ATA CCC TAC CCT TTA AGG GGG GCT GTT ATC ACT 336 
Ser Phe Lys Glu Trp lie Pro Tyr Pro Leu Arg Gly Ala Val lie Thr 
300 305 310 

^ T GGG AAT ATT AAA GGG CAT AGA AAA GCC CTT ATG ATT CAA GGC GTC 3 84 

er Gly Asn lie Lys Gly His Arg Lys Ala Leu Met lie Gin Gly Val 
315 320 325 

TCT AAT GTG GCT CAA TCC CAC ACT GCC TAC AAT GCC CTT TTA GAT GAT 43 2 

Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
330 335 340 

TTC AAG CTT TCT CGC TTA AAT TTG AAC GCA CAA GAC GCC AAT TTA GAA 4 80 

Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
345 350 355 360 

GAT TTG CTT TAT TTA ATC AAT CGC CCC GCT TAT GCG AAC GCA AAA GTG 52 8 

Asp Leu Leu Tyr Leu lie Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 
365 370 375 

TCC TTA CAG GCG GAT TTT AAC TCT CTA AAG CCT TTA GAG GGG CAT TTG 576 
Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 



380 



385 



390 



ATC CTA ACA GCT AAT AAC GCT TTA ATC AAT AAC GCC CTA ATC AAT CAA 
lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu lie Asn Gin 
395 400 405 

ATT TTT CAT TTA AAC CTT AAA GAC ACG CTT GTT TTC AGC CTC TCG CAT 
lie Phe His Leu Asrx Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
410 415 420 

TCA AGC GAC TTT AAA GGA AAC AAA GCC ATC AGC GAT ACC ACC CTG ACT 
Ser Ser Asp Phe Lys Gly Asn Lys Ala lie Ser Asp Thr Thr Leu Thr 
425 430 435 440 

AGC CCT TTA GCC AAT TTC AAA GCC CTA AAA AGC GAA TAC CTT TTC TCT 
Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
445 450 455 

ATT TTA AAA CTC AAC GCC CCC TAC ACT TTA GAA ATC CCC AAT CTA GCC 
lie Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu lie Pro Asn Leu Ala 
460 465 470 



CTC TAT AAC ATT ACC AAC CAC CCC TTA AAA GGG AGC TTG ACT TTA 
Lys Leu Tyr Asn lie Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
475 480 485 

AAA GGC GCT ATA GAA CAA AGC CCC AAA CTT TTA AAA GTC AGC GGC CAT 
Lys Gly Ala lie Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
490 495 500 

TCA AAT TTA CTA GAC GGC GCG CTG GAT TTC ACG CTT TTA AAT AAA GAT 
Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
505 510 515 520 

TTG AAA GGG CGT TTT TCC AAT ATT TCC ACT TTA AAA GCT TTA GAT TTA 
Leu Lys Gly Arg Phe Ser Asn lie Ser Thr Leu Lys Ala Leu Asp Leu 
525 530 535 

TTC CAT TAC CCT AAG TTT TTC CAA TCC GTT GCA GAC GCT AAT TTG GAT 
Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
540 545 550 



JAT GAT CTT ATC GCT AAG CAA GGC GTA TTG AAA GCC CGC CTA AAA AAC 
r Asp Leu lie Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
555 560 565 



GCA AGA TTC CTC AAA AAT GCA TTC AGC GAT TTT CTC TAC TCC ATT TCT 
Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser lie Ser 
570 575 580 

AAA TTT GAT ATT ACA AAA GAA ATT TAT AAC GAT GCC AAT CTG GTA AGC 
Lys Phe Asp lie Thr Lys Glu lie Tyr Asn Asp Ala Asn Leu Val Ser 
585 590 595 600 

CAA ATC AAC CAG CAA CGC CTG CTC TCT GAT CTG AGT TTA AAA AGC CCC 
Gin lie Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
605 610 615 

AAA ACC CAA TTG AAA ATC CAT AAC GGT TTG TTG GAT TTA AAC ACC AAA 
Lys Thr Gin Leu Lys lie His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
620 625 630 
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CAA ATG AAC ATG CTC ATG GAT GCG GAA ATT TTA AAA TTC ATT TTT AAA 1344 
Gin Met Asn Met Leu Met Asp Ala Glu lie Leu Lys Phe lie Phe Lys 
635 640 645 

ATG AAA CTT CAA GGC AAC ATG CAC CAG CCA AAA TTT TCT CTC ATT TTA 13 92 

Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu lie Leu 
650 655 660 

AAC GAA AAA GCC ATT CAG CAA AAC TTG CAA CAA GGC TTG AAA GAA ATC 1440 
Asn Glu Lys Ala lie Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu lie 
665 670 675 680 

TTA AAA AAC GAC ACC CTT AAA AAA GGT TTA GAT CAT TTG CTT AAA GAT 1488 
Leu Lys Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
685 690 695 

GAT AAG CTC AAA GAA AAG CTT GAA AAA GGG CTT AAG GGG CTT TTT TAA 1536 
Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe * 
700 705 710 



2) ANGABEN ZU SEQ ID NO: 44: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 512 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEK&LS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 44: 

Met Lys Lys Leu Leu Tyr Thr lie Leu Ala Leu Leu Leu lie Gly Leu 
1 5 10 15 

Leu Thr lie Tyr Leu lie Leu Phe Thr Glu Trp Gly Asn Lys lie lie 
20 25 30 

Ala Ser Tyr lie Glu Lys Lys lie Asn Pro Asn Glu His Tyr Leu Ser 
35 40 45 



Val Lys Thr Phe Lys Leu Arg Phe Asn Ser Leu Asp Phe Lys Ala Gin 
50 55 60 



a Asn Asp Asp Ser Thr Leu lie Leu Lys Gly Asp Phe Ser Leu Leu 
5 70 75 80 



Lys Gin Ser Val Asn Leu Asn Tyr His lie Asp lie Lys Asp Leu Arg 

85 90 95 

Ser Phe Lys Glu Trp lie Pro Tyr Pro Leu Arg Gly Ala Val lie Thr 
100 105 110 

Ser Gly Asn lie Lys Gly His Arg Lys Ala Leu Met lie Gin Gly Val 
115 120 125 

Ser Asn Val Ala Gin Ser His Thr Ala Tyr Asn Ala Leu Leu Asp Asp 
130 135 140 

Phe Lys Leu Ser Arg Leu Asn Leu Asn Ala Gin Asp Ala Asn Leu Glu 
14 5 150 155 160 

Asp Leu Leu Tyr Leu lie Asn Arg Pro Ala Tyr Ala Asn Ala Lys Val 
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165 170 175 

Ser Leu Gin Ala Asp Phe Asn Ser Leu Lys Pro Leu Glu Gly His Leu 
180 185 190 

lie Leu Thr Ala Asn Asn Ala Leu lie Asn Asn Ala Leu lie Asn Gin 
195 200 205 

lie Phe His Leu Asn Leu Lys Asp Thr Leu Val Phe Ser Leu Ser His 
210 215 220 

Ser Ser Asp Phe Lys Gly Asn Lys Ala lie Ser Asp Thr Thr Leu Thr 
225 230 235 240 

Ser Pro Leu Ala Asn Phe Lys Ala Leu Lys Ser Glu Tyr Leu Phe Ser 
245 250 255 



lie Leu Lys Leu Asn Ala Pro Tyr Thr Leu Glu lie Pro Asn Leu Ala 
260 265 270 



ys Leu Tyr Asn lie Thr Asn His Pro Leu Lys Gly Ser Leu Thr Leu 
275 280 285 



Lys Gly Ala lie Glu Gin Ser Pro Lys Leu Leu Lys Val Ser Gly His 
290 295 300 

Ser Asn Leu Leu Asp Gly Ala Leu Asp Phe Thr Leu Leu Asn Lys Asp 
305 310 315 320 

Leu Lys Gly Arg Phe Ser Asn lie Ser Thr Leu Lys Ala Leu Asp Leu 
325 330 335 

Phe His Tyr Pro Lys Phe Phe Gin Ser Val Ala Asp Ala Asn Leu Asp 
340 345 350 

Tyr Asp Leu lie Ala Lys Gin Gly Val Leu Lys Ala Arg Leu Lys Asn 
355 360 365 

Ala Arg Phe Leu Lys Asn Ala Phe Ser Asp Phe Leu Tyr Ser lie Ser 
370 375 380 



Lys Phe Asp lie Thr Lys Glu lie Tyr Asn Asp Ala Asn Leu Val Ser 
~85 390 395 400 



n lie Asn Gin Gin Arg Leu Leu Ser Asp Leu Ser Leu Lys Ser Pro 
405 410 415 

Lys Thr Gin Leu Lys lie His Asn Gly Leu Leu Asp Leu Asn Thr Lys 
420 425 430 

Gin Met Asn Met Leu Met Asp Ala Glu lie Leu Lys Phe lie Phe Lys 
435 440 445 

Met Lys Leu Gin Gly Asn Met His Gin Pro Lys Phe Ser Leu lie Leu 
450 455 460 

Asn Glu Lys Ala He Gin Gin Asn Leu Gin Gin Gly Leu Lys Glu He 
4 65 470 475 480 

Leu Lyo Asn Asp Thr Leu Lys Lys Gly Leu Asp His Leu Leu Lys Asp 
485 490 495 
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Asp Lys Leu Lys Glu Lys Leu Glu Lys Gly Leu Lys Gly Leu Phe 
500 505 510 



(2) ANGABEN ZU SEQ ID NO: 45: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 540 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS144 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE: 1 . .540 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 45: 

ATG AAG AGA TCT TCT GTA TTT AGT TTC TTG GTA GCT TTT TTA TTG GTA 48 
Met Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
515 520 525 

GCT GGC TGT AGT CAT AAA ATG GAT AAT AAG ACT GTG GCC GGC GAT GTG 96 
Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
530 535 540 



AGT GCT AAA ACG GTT CAG ACT GCA CCT GTT ACT ACA GAA CCA GCT CCA 144 
Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
545 550 555 560 



GAG AAA GAA GAG CCT AAA CAA GAG CCA GCT CCA GTG GTT GAA GAA AAA 192 
Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
565 570 575 

CCG GCT GTT GAG AGC GGG ACT ATC ATC GCT TCT ATT TAT TTT GAT TTT 240 
£ro Ala Val Glu Ser Gly Thr He He Ala Ser He Tyr Phe Asp Phe 
^ 580 585 590 



■AC AAG TAT GAA ATC AAA GAA TCC GAT CAA GAG ACT TTA GAT GAG ATC 28 8 

Asp Lys Tyr Glu He Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu He 



595 600 605 

GTG CAA AAA GCT AAA GAA AAC CAC ATG CAA GTG CTT TTG GAA GGC AAT 336 
Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
610 615 620 

ACC GAT GAA TTT GGC TCT AGC GAA TAC AAC CAA GCG CTT GGC GTT AAA 3 84 

Thr Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
625 630 635 640 

AGG ACT TTG AGC GTG AAA AAC GCT TTA GTC ATT AAA GGG GTA GAA AAA 4 32 

Arg Thr Leu Ser Val Lys Asn Ala Leu Val He Lys Gly Val Glu Lys 
645 650 655 



GAT ATG ATC AAA ACC ATC AGT TTT GGT GAA ACC AAA CCC AAA TGC GCC 
Asp Met He Lys Thr He Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 



480 



70 



660 665 670 

CAA AAA ACT AGA GAG TGT TAT AAA GAA AAC AGA AGA GTG GAT GTC AAA 52 8 

Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
675 680 685 

TTA ATG AAG TAA 540 
Leu Met Lys * 
690 



(2) ANGABEN ZU SEQ ID NO: 46: 

<i) SEQUENZKENNZEICHEN: 

(A) LANGE: 180 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 46: 

et Lys Arg Ser Ser Val Phe Ser Phe Leu Val Ala Phe Leu Leu Val 
1 5 10 15 

Ala Gly Cys Ser His Lys Met Asp Asn Lys Thr Val Ala Gly Asp Val 
20 25 30 

Ser Ala Lys Thr Val Gin Thr Ala Pro Val Thr Thr Glu Pro Ala Pro 
35 40 45 

Glu Lys Glu Glu Pro Lys Gin Glu Pro Ala Pro Val Val Glu Glu Lys 
50 55 60 

Pro Ala Val Glu Ser Gly Thr He He Ala Ser He Tyr Phe Asp Phe 
65 70 75 80 

Asp Lys Tyr Glu He Lys Glu Ser Asp Gin Glu Thr Leu Asp Glu He 
85 90 95 

Val Gin Lys Ala Lys Glu Asn His Met Gin Val Leu Leu Glu Gly Asn 
100 105 110 

r Asp Glu Phe Gly Ser Ser Glu Tyr Asn Gin Ala Leu Gly Val Lys 
US 120 125 

Arg Thr Leu Ser Val Lys Asn Ala Leu Val He Lys Gly Val Glu Lys 
130 135 140 

Asp Met He Lys Thr He Ser Phe Gly Glu Thr Lys Pro Lys Cys Ala 
145 150 155 160 

Gin Lys Thr Arg Glu Cys Tyr Lys Glu Asn Arg Arg Val Asp Val Lys 
165 170 175 

Leu Met Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 47: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1560 Basenpaare 

(B) ART: Nucleotid 
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(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPC140, HPC150, HPC179 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . . 1560 — /"iJr 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 47: 

CAA ATG ATA AAA AAG AAT AGA ACG CTG TTT CTT AGT CTA GCC CTT TGC 48 
Gin Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys 
185 190 195 



>CT AGC ATA AGT TAT GCC GAA GAT GAT GGA GGG TTT TTC ACC GTC GGT 96 
jLa Ser lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly 
F 200 205 210 

TAT CAG CTC GGG CAA GTC ATG CAA GAT GTC CAA AAC CCA GGC GGC GCT 144 
Tyr Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala 
215 220 225 



AAA AGC GAC GAA CTC GCC AGA GAG CTT AAC GCT GAT GTA ACG AAC AAC 192 
Lys Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn 
230 235 240 



ATT TTA AAC AAC AAC ACC GGA GGC AAC ATC GCA GGG GCG TTG AGT AAC 240 
He Leu Asn Asn Asn Thr Gly Gly Asn He Ala Gly Ala Leu Ser Asn 
245 250 255 260 



GCT TTC TCC CAA TAC CTT TAT TCG CTT TTA GGG GCT TAC CCC ACA AAA 288 
Ala Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys 
265 270 275 

CTC AAT GGT AGC GAT GTG TCT GCG AAC GCT CTT TTA AGT GGT GCG GTA 336 
Leu Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val 

280 oq c ->ftft 



280 285 290 

TCT GGG 

y 



C TCT GGG ACT TGT GCG GCT GCA GGG ACG GCT GGT GGC ACT TCT CTT 3 84 

y Ser Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu 
295 300 305 

AAC ACT CAA AGC ACT TGC ACC GTT GCG GGC TAT TAC TGG CTC CCT AGC 432 

Asn Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser 
310 315 320 

TTG ACT GAC AGG ATT TTA AGC ACG ATC GGC AGC CAG ACT AAC TAC GGC 4 80 

Leu Thr Asp Arg He Leu Ser Thr He Gly Ser Gin Thr Asn Tyr Gly 

325 330 335 340 

ACG AAC ACC AAT TTC CCC AAC ATG CAA CAA CAG CTC ACC TAC TTG AAT 52 8 

Thr Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn 
345 350 355 

GCG GGG AAT GTG TTT TTT AAT GCG ATG AAT AAG GCT TTA GAG AAT AAG 57 6 

Ala Gly Aon Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys 
360 365 370 
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AAT GGA ACT AGT AGT GCT AGT GGA ACT AGT GGT GCG ACT GGT TCA GAT 624 
Asn Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp 
375 380 385 

GGT CAA ACT TAC TCC ACA CAA GCT ATC CAA TAC CTT CAA GGC CAA CAA 672 
Gly Gin Thr Tyr Ser Thr Gin Ala He Gin Tyr Leu Gin Gly Gin Gin 
390 395 400 

AAT ATC TTA AAT AAC GCA GCG AAC TTG CTC AAG CAA GAT GAA TTG CTC 720 
Asn He Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu 
405 410 415 420 

TTA GAA GCT TTC AAC TCT GCC GTA GCC GCC AAC ATT GGG AAT AAG GAA 768 
Leu Glu Ala Phe Asn Ser Ala Val Ala Ala Asn He Gly Asn Lys Glu 
425 430 435 

TTC AAT TCA GCC GCT TTT ACA GGT TTG GTG CAA GGC ATT ATT GAT CAA 816 
Phe Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly He He Asp Gin 
440 445 450 



T CAA GCG GTT TAT AAC GAG CTC ACT AAA AAC ACC ATT AGC GGG AGT 864 
er Gin Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr He Ser Gly Ser 
455 460 465 

GCG GTT ATT AGC GCT GGG ATA AAC TCC AAC CAA GCT AAC GCT GTG CAA 912 
Ala Val He Ser Ala Gly He Asn Ser Asn Gin Ala Asn Ala Val Gin 
470 475 480 

GGG CGC GCT AGT CAG CTC CCT AAC GCT CTT TAT AAC GCG CAA GTA ACT 960 
Gly Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr 
485 490 495 500 

TTG GAT AAA ATC AAT GCG CTC AAT AAT CAA GTG AGA AGC ATG CCT TAC 10 0 8 

Leu Asp Lys He Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr 
505 510 515 

TTG CCC CAA TTC AGA GCC GGG AAC AGC CGT TCA ACG AAT ATT TTA AAC 1056 
Leu Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn He Leu Asn 
520 525 530 



GGG TTT TAC ACC AAA ATA GGC TAT AAG CAA TTC TTC GGG AAG AAA AGG 1104 
Gly Phe Tyr Thr Lys He Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg 
535 540 545 



T ATC GGT TTG CGC TAT TAT GGT TTC TTT TCT TAT AAC GGA GCG AGC 1152 
Asn He Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser 
550 555 560 

GTG GGC TTT AGA TCC ACT CAA AAT AAT GTA GGG TTA TAC ACT TAT GGG 12 00 

Val Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly 
565 570 575 580 

GTG GGG ACT CAT GTG TTG TAT AAC ATC TTT AGC CGC TCC TAT CAA AAC 124 8 

Val Gly Thr Asp Val Leu Tyr Asn He Phe Ser Arg Ser Tyr Gin Asn 
585 590 595 

CGC TCT GTG GAT ATG GGC TTT TTT AGC GGT ATC CAA TTA GCC GGT GAG 12 96 

Arg Ser Val Asp Met Gly Phe Phe Ser Gly He Gin Leu Ala Gly Glu 
600 605 610 

ACC TTC CAA TCC ACG CTC AGA GAT GAC CCC AAT GTG AAA TTG CAT GGG 134 4 

Thr Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly 
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615 620 625 

AAA ATC AAT AAC ACG CAC TTC GAG TTC CTC TTT GAC TTC GGT ATG AGG 13 92 

Lys lie Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg 
630 635 640 

ATG AAC TTC GGT AAG TTG GAC GGG AAA TCC AAC CGC CAC AAC CAG CAC 144 0 

Met Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His 
645 650 655 660 

ACG GTG GAA TTT GGC GTA GTG GTG CCT ACG ATT TAT AAC ACT TAT TAC 14 88 

Thr Val Glu Phe Gly Val Val Val Pro Thr lie Tyr Asn Thr Tyr Tyr 
665 670 675 

AAA TCA GCA GGG ACT ACC GTG AAG TAT TTC CGT CCT TAT AGC GTT TAT 1536 
Lys Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr 
680 685 690 

TGG TCT TAT GGG TAT TCA TTC TAA 1560 
^rp Ser Tyr Gly Tyr Ser Phe * 
695 700 

(2) ANGABEN ZU SEQ ID NO: 48: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 520 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 48: 

Gin Met lie Lys Lys Asn Arg Thr Leu Phe Leu Ser Leu Ala Leu Cys 
1 5 10 15 

Ala Ser lie Ser Tyr Ala Glu Asp Asp Gly Gly Phe Phe Thr Val Gly 
20 25 30 

Tyr Gin Leu Gly Gin Val Met Gin Asp Val Gin Asn Pro Gly Gly Ala 
35 40 45 

s Ser Asp Glu Leu Ala Arg Glu Leu Asn Ala Asp Val Thr Asn Asn 
50 55 60 

He Leu Asn Asn Asn Thr Gly Gly Asn He Ala Gly Ala Leu Ser Asn 
65 70 75 80 

Ala Phe Ser Gin Tyr Leu Tyr Ser Leu Leu Gly Ala Tyr Pro Thr Lys 

85 90 95 

Leu Asn Gly Ser Asp Val Ser Ala Asn Ala Leu Leu Ser Gly Ala Val 
100 105 110 

Gly Ser Gly Thr Cys Ala Ala Ala Gly Thr Ala Gly Gly Thr Ser Leu 
115 120 125 

Asn Thr Gin Ser Thr Cys Thr Val Ala Gly Tyr Tyr Trp Leu Pro Ser 
130 135 140 

Leu Thr Asp Arg He Leu Ser Thr He Gly Ser Gin Thr Asn Tyr Gly 
14 5 150 155 160 
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Thr Asn Thr Asn Phe Pro Asn Met Gin Gin Gin Leu Thr Tyr Leu Asn 
165 170 175 

Ala Gly Asn Val Phe Phe Asn Ala Met Asn Lys Ala Leu Glu Asn Lys 
180 185 190 

Asn Gly Thr Ser Ser Ala Ser Gly Thr Ser Gly Ala Thr Gly Ser Asp 
195 . 200 205 

Gly Gin Thr Tyr Ser Thr Gin Ala He Gin Tyr Leu Gin Gly Gin Gin 
210 215 220 

Asn He Leu Asn Asn Ala Ala Asn Leu Leu Lys Gin Asp Glu Leu Leu 
225 230 235 240 

Leu Glu Ala Phe Asn Ser Ala Val Ala Ala Asn He Gly Asn Lys Glu 
245 250 255 

Phe Asn Ser Ala Ala Phe Thr Gly Leu Val Gin Gly lie He Asp Gin 
260 265 270 

er Gin Ala Val Tyr Asn Glu Leu Thr Lys Asn Thr He Ser Gly Ser 
275 280 285 

Ala Val He Ser Ala Gly He Asn Ser Asn Gin Ala Asn Ala Val Gin 
290 295 300 

Gly Arg Ala Ser Gin Leu Pro Asn Ala Leu Tyr Asn Ala Gin Val Thr 
305 310 315 320 

Leu Asp Lys He Asn Ala Leu Asn Asn Gin Val Arg Ser Met Pro Tyr 
325 330 335 

Leu Pro Gin Phe Arg Ala Gly Asn Ser Arg Ser Thr Asn He Leu Asn 
340 345 350 

Gly Phe Tyr Thr Lys He Gly Tyr Lys Gin Phe Phe Gly Lys Lys Arg 
355 360 365 

Asn He Gly Leu Arg Tyr Tyr Gly Phe Phe Ser Tyr Asn Gly Ala Ser 
370 375 380 

1 Gly Phe Arg Ser Thr Gin Asn Asn Val Gly Leu Tyr Thr Tyr Gly 
5 390 395 400 

val Gly Thr Asp Val Leu Tyr Asn He Phe Ser Arg Ser Tyr Gin Asn 
405 410 415 

Arg Ser Val Asp Met Gly Phe Phe Ser Gly He Gin Leu Ala Gly Glu 
420 425 430 

Thr Phe Gin Ser Thr Leu Arg Asp Asp Pro Asn Val Lys Leu His Gly 
435 440 445 

Lys He Asn Asn Thr His Phe Gin Phe Leu Phe Asp Phe Gly Met Arg 
4 50 455 460 

Met Asn Phe Gly Lys Leu Asp Gly Lys Ser Asn Arg His Asn Gin His 
465 470 475 480 

Thr Val Glu Phe Gly Val Val Val Pro Thr He Tyr Asn Thr Tyr Tyr 
485 490 495 
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Lys Ser Ala Gly Thr Thr Val Lys Tyr Phe Arg Pro Tyr Ser Val Tyr 
500 505 510 

Trp Ser Tyr Gly Tyr Ser Phe * 
515 520 

(2) ANGABEN ZU SEQ ID NO: 49: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1062 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS152 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1062 




(xi) SEQUEN2BESCHREIBUNG: SEQ ID NO : 49: 

TTG AAA CAT TTA ACC CCA CTC ACT CAC ACC ATC TTT AAA GCC TTA TGG 4 8 

Leu Lys His Leu Thr Pro Leu Thr His Thr lie Phe Lys Ala Leu Trp 
525 530 535 

CTA GGC ACA GCC TTA AGT GCA TCT TTA AGT TTA GCC GCA ACA GAA AGC 96 
Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
540 545 550 

CCC ACT AAA ACA GAG CCT AAG CCC GCT AAA GGG GTT AAA AAC AAG CCC 144 
Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
555 560 565 

AAA TCG CCC GTT ACT AAA GTC ATG ATG ACC AAT TGC GAC AAT ATT AAA 192 
Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn lie Lys 
570 575 580 

/T TTT AAC GCT AAG CAA AAA GAA GTC TTA AAA GCC GCT TAT CAA TTC 24 0 

ip Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
15 590 595 600 

GGC TCT AAA GAA AAT TTA GGC TAT GAA ATG GCA GGC ATT GCA TGG AAA 288 
Gly Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly lie Ala Trp Lys 
605 610 615 

GAG TCA TGC GCA GGG GTT TAT AAA ATC AAT TTT TCG GAT CCG AGC GCG 33 6 

Glu Ser Cys Ala Gly Val Tyr Lys lie Asn Phe Ser Asp Pro Ser Ala 
620 625 630 

GGC GTG TAT CAT TCT TAT ATC CCA AGC GTT CTA AAA AGC TAT GGG CAT 3 84 

Gly Val Tyr His Ser Tyr He Pro Ser Val Leu Lys Ser Tyr Gly His 
635 640 645 

AAT GAT AGC CCC TTT TTG CGT AAT GTG ATG GGG GAA TTG CTC ATT AAA 4 32 

Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu He Lys 
650 655 660 
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GAC GAT GCG TTT GCT TCT GAA GTG GCT TTA AAA GAG TTG CTC TAT TGG 480 
Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Trp 
665 670 675 680 

AAA ACA CGC TAC CAT GAC AAT TTA AAA GAC ATG ATT AAA TCT TAC AAC 52 8 

Lys Thr Arg Tyr His Asp Asn Leu Lys Asp Met lie Lys Ser Tyr Asn 
685 690 695 

AAG GGC AGT CGT TGG GAA AGG AGC GAA AAA TCT AAC GCT GAT GCT GAA 576 
Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
700 705 710 

AAA TAT TAC GAA GAG ATA CAA GAC AGA ATC AGG CGT TTG AAA GAA TCT 624 
Lys Tyr Tyr Glu Glu lie Gin Asp Arg lie Arg Arg Leu Lys Glu Ser 
715 720 725 

AAA ATC TTT GAT TCG CAG TCT AGT AAT GAC CAA GAA TTG CAA AAA AGC 672 
Lys lie Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
730 735 740 

|CT AAT AGC AAC CTG GAT TTA GAC CCT ATC GGC AAC GCC ATG CCC CAA 72 0 

la Asn Ser Asn Leu Asp Leu Asp Pro He Gly Asn Ala Met Pro Gin 
745 750 755 760 

GCC TTA ATT GCC AAA GAA ACT AAA ATA GAA GAA ACC CAA GCA GAA AAA 768 
Ala Leu He Ala Lys Glu Thr Lys He Glu Glu Thr Gin Ala Glu Lys 
765 770 775 

TCC CAA GAA ATG AAA GAG ACA ACT AGC GAG CAA ACA AAA AGT AAG CCA 816 
Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
780 785 790 

GAA AAA GCA AAA GAT AAA CCC ATG TAT TTG GCG CAA ATC AAC AGC ACT 864 
Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin He Asn Ser Thr 
795 800 805 

GAT TTC ACA CCC GTT AAA AAA AGC CCC AAA AAA CCG GCT AAA GTG AGC 912 
Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
810 815 820 



m 



CAA AAA CAC TCC TTT AAG AAT AAC ATT AAA AAT AAT GTA AAA AAC AAC 960 
Gin Lys His Ser Phe Lys Asn Asn He Lys Asn Asn Val Lys Asn Asn 
5 830 835 840 



CC AAA ACC GCT TCC AAA AAA CAA GAA ATG TGC AAA AAT TGC TCT CCA 1008 
Ala Lys Thr Ala Ser Lys Lys Gin Glu Met Cys Lys Asn Cys Ser Pro 
845 850 855 

GGG CAA AGG AAT GCG ATT TTA GCT AAC CAC ATC ACT CTC ATG CAA GAG 1056 
Gly Gin Arg Asn Ala He Leu Ala Asn His He Thr Leu Met Gin Glu 
860 865 870 

CTT TAA 1062 
Leu * 



(2) ANGABEN ZU SEQ ID NO: 50: 



( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 354 Aminosauren 

(B) ART: Aminosaure 



• 



77 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 50: 

Leu Lys His Leu Thr Pro Leu Thr His Thr He Phe Lys Ala Leu Trp 
1 5 10 15 

Leu Gly Thr Ala Leu Ser Ala Ser Leu Ser Leu Ala Ala Thr Glu Ser 
20 25 30 

Pro Thr Lys Thr Glu Pro Lys Pro Ala Lys Gly Val Lys Asn Lys Pro 
35 40 45 

Lys Ser Pro Val Thr Lys Val Met Met Thr Asn Cys Asp Asn He Lys 
50 55 60 

Asp Phe Asn Ala Lys Gin Lys Glu Val Leu Lys Ala Ala Tyr Gin Phe 
65 70 75 80 

.y Ser Lys Glu Asn Leu Gly Tyr Glu Met Ala Gly He Ala Trp Lys 
85 90 95 



Glu Ser Cys Ala Gly Val Tyr Lys He Asn Phe Ser Asp Pro Ser Ala 
100 105 110 

Gly Val Tyr His Ser Tyr He Pro Ser Val Leu Lys Ser Tyr Gly His 
115 120 125 

Asn Asp Ser Pro Phe Leu Arg Asn Val Met Gly Glu Leu Leu He Lys 
130 135 140 

Asp Asp Ala Phe Ala Ser Glu Val Ala Leu Lys Glu Leu Leu Tyr Tro 
145 ISO 155 160 

Lys Thr Arg Tyr His Asp Asn Leu Lys Asp Met He Lys Ser Tyr Asn 
165 170 175 

Lys Gly Ser Arg Trp Glu Arg Ser Glu Lys Ser Asn Ala Asp Ala Glu 
180 185 190 

Lys Tyr Tyr Glu Glu He Gin Asp Arg He Arg Arg Leu Lys Glu Ser 
^ 195 200 205 

s He Phe Asp Ser Gin Ser Ser Asn Asp Gin Glu Leu Gin Lys Ser 
21° 215 220 

Ala Asn Ser Asn Leu Asp Leu Asp Pro He Gly Asn Ala Met Pro Gin 
225 230 235 240 

Ala Leu He Ala Lys Glu Thr Lys He Glu Glu Thr Gin Ala Glu Lys 
245 250 255 

Ser Gin Glu Met Lys Glu Thr Thr Ser Glu Gin Thr Lys Ser Lys Pro 
260 265 270 

Glu Lys Ala Lys Asp Lys Pro Met Tyr Leu Ala Gin He Asn Ser Thr 
275 280 285 

Asp Phe Thr Pro Val Lys Lys Ser Pro Lys Lys Pro Ala Lys Val Ser 
290 295 300 
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Gin Lys His Ser Phe Lys Asn Asn lie Lys Asn Asn Val Lys Asn Asn 
305 310 315 320 

Ala Lys Thr Ala Ser Lys Lys Gin Glu Met Cys Lys Asn Cys Ser Pro 
325 330 335 

Gly Gin Arg Asn Ala lie Leu Ala Asn His lie Thr Leu Met Gin Glu 
340 345 350 

Leu * 



(2) ANGABEN ZU SEQ ID NO: 51: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 2202 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTELB ARE HERKUNFT : 
(B) CLON(E) : HPS155 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..2202 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 51: 

ATG GCA AAC GAA CGC TCC AAA TTA GCT TTT AAA AAG ACT TTC CCT GTC 48 
Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
355 360 365 370 

TTT AAA CGC TTT TTG CAA TCC AAA GAC TTA GCC CTT GTG GTC TTT GTG 96 
Phe Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
375 380 385 



ATC GCT ATT TTG GCG ATC ATT ATC GTG CCG TTA CCG CCT TTT GTG TTG 144 
lie Ala lie Leu Ala lie lie lie Val Pro Leu Pro Pro Phe Val Leu 
390 395 400 



T TTT TTA CTC ACG ATT TCT ATC GCG CTG TCG GTG TTG * ATT ATT TTA 192 
Asp Phe Leu Leu Thr lie Ser lie Ala Leu Ser Val Leu lie lie Leu 
405 410 415 



ATT 


GGG 


CTT 


TAT 


ATT 


GAC 


AAG 


CCG 


ACT 


GAT 


TTT 


AGC 


GCT 


TTC 


CCC 


ACT 


240 


lie 


Gly 


Leu 


Tyr 


He 


Asp 


Lys 


Pro 


Thr 


Asp 


Phe 


Ser 


Ala 


Phe 


Pro 


Thr 






420 










425 










430 












TTA 


TTG 


CTC 


ATT 


GTA 


ACC 


TTG 


TAT 


CGC 


TTG 


GCT 


TTA 


AAT 


GTC 


GCC 


ACC 


288 


Leu 


Leu 


Leu 


He 


Val 


Thr 


Leu 


Tyr 


Arg 


Leu 


Ala 


Leu 


Asn 


Val 


Ala 


Thr 




435 










440 






445 










450 




ACT 


AGA 


ATG 


ATT 


TTA 


ACG 


CAA 


GGC 


TAT 


AAA 


GGG 


CCT 


AGT 


GCG 


GTG 


AGC 


336 


Thr 


Arg 


Met 


He 


Leu 


Thr 


Gin 


Gly 


Tyr 


Lys 


Gly 


Pro 


Ser 


Ala 


Val 


Ser 












455 










460 










465 







GAT ATT ATC ACG GCG TTT GGG GAA TTT AGC GTG AGC GGG AAT TAT GTG 
Acp He He Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 



384 
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470 475 480 

ATT GGG GCG ATT ATC TTT AGT ATT TTA GTG CTA GTG AAT CTA TTA GTG 432 
lie Gly Ala lie lie Phe Ser lie Leu Val Leu Val Asn Leu Leu Val 
485 490 495 

GTT ACT AAT GGC TCT ACT AGG GTT ACT GAA GTG AGG GCG CGA TTT GCC 480 
Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
500 505 510 

CTA GAT GCT ATG CCA GGA AAG CAA ATG GCG ATT GAT GCG GAT TTA AAC 52 8 

Leu sp Ala Met Pro Gly Lys Gin Met Ala lie Asp Ala Asp Leu Asn 
515 520 525 530 

TCA GGA CTT ATT GAC GAT AAG GAA GCC AAA AAA CGG CGC GCC GCT CTA 576 
Ser Gly Leu lie Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
535 540 545 



AGC CAA GAA GCG GAT TTT TAT GGC GCG ATG GAT GGC GGA TCT AAA TTC 624 
er Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
550 555 560 



TC AAA GGC GAT GCG ATC GCT TCT ATC ATC ATC ACG CTT ATC AAT ATC 672 
Val Lys Gly Asp Ala lie Ala Ser lie He He Thr Leu He Asn He 
565 570 575 

ATT GGA GGG TTT TTA GTG GGC GTG TTT CAA AGG GAT ATG AGC TTG AGC 72 0 

He Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
580 585 590 

TTT AGC GCT AGC ACT TTC ACT ATC TTA ACC ATT GGC GAT GGG CTT GTG 768 
Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
595 600 605 610 

GGG CAA ATC CCT GCC TTA ATC ATT GCG ACA GCG ACC GGT ATT GTC GCC 816 
Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
615 620 625 

ACT CGC ACC ACG CAA AAT GAA GAA GAG GAC TTT GCT TCC AAA CTC ATC 864 
Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
630 635 640 

A CAG CTC ACC AAT AAA AGC AAA ACT TTA GTG ATT GTG GGA GCG ATT 912 
r Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
645 650 655 

TTA TTG CTT TTT GCC ACC ATT CCT GGA CTC CCT ACC TTT TCT TTA GCG 960 
Leu Leu Leu Phe Ala Thr He Pro Gly Leu Pro Thr Phe Ser Leu Ala 
660 665 670 

TTT GTA GGG ACT CTC TTT TTA TTC ATC GCA TGG CTG ATT AGC AGG GAG 1008 
Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
675 680 685 690 

GGG AAA GAC GGG CTG CTC ACT AAA TTA GAA AAT TAT TTG AGT CAA AAA 1056 
Gly Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
695 700 705 

TTC GGC TTG GAT TTG AGC GAA AAA CCC CAC AGC TCC AAA ATC AAA CCC 1104 
Phe Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
710 715 720 
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CAC ACC CCA ACC ACA AGG GCT AAA ACC CAA GAA GAG CTT AAA AGA GAA 1152 
His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
725 730 735 

GAA GAG CAA GCG ATT GAT GAA GTG TTA AAA ATT GAA TTT TTA GAA CTG 12 00 

Glu Glu Gin Ala lie Asp Glu Val Leu Lys lie Glu Phe Leu Glu Leu 
740 745 750 

GCT TTA GGC TAT CAA CTC ATC AGT CTT GCG GAC ATG AAA CAA GGG GGC 124 8 

Ala Leu Gly Tyr Gin Leu lie Ser Leu Ala Asp Met Lys Gin Gly Gly 
755 760 765 770 

GAT TTG TTA GAA AGG ATT AGG GGT ATT AGA AAA AAG ATA GCG AGC GAT 12 96 

Asp Leu Leu Glu Arg lie Arg Gly lie Arg Lys Lys lie Ala Ser Asp 
775 780 785 

TAT GGT TTT TTG ATG CCT CAA ATC CGG ATC AGG GAT AAT TTG CAG CTC 1344 
Tyr Gly Phe Leu Met Pro Gin lie Arg lie Arg Asp Asn Leu Gin Leu 
790 795 — 800 



C CCA ACG CAT TAT GAA ATC AAA CTT AAA GGC ATT GTG ATT GGT GAG 1392 
o Pro Thr His Tyr Glu lie Lys Leu Lys Gly lie Val lie Gly Glu 
80S 810 815 



GGC ATG GTG ATG CCA GAC AAG TTT TTA GCC ATG AAT ACC GGT TTT GTG 144 0 

Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
820 825 830 

AAT AAA GAA ATT GAA GGC ATT CCT ACT AAA GAG CCG GCT TTT GGA ATG 1488 
Asn Lys Glu lie Glu Gly lie Pro Thr Lys Glu Pro Ala Phe Gly Met 
835 840 845 850 

GAC GCT TTA TGG ATT GAA ACT AAA AAT AAA GAA GAA GCC ATT ATT CAA 153 6 

Asp Ala Leu Trp lie Glu Thr Lys Asn Lys Glu Glu Ala lie lie Gin 
855 860 865 

GGC TAT ACC ATT ATT GAT CCA AGC ACC GTT ATT GCG ACG CAC ACC AGC 1584 
Gly Tyr Thr lie He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
870 875 880 

GAA TTA GTG AAA AAA TAC GCT GAA GAT TTT ATC ACT AAA GAT GAA GTG 1632 
Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
^ 885 890 895 



TCC CTT TTA GAG CGC TTG GCC AAA GAT TAT CCT ACG ATT GTA GAA 1680 
Lys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
900 905 910 

GAG AGT AAA AAA ATC CCC ACC GGT GCG ATC CGA TCA GTC TTG CAA GCC 1728 
Glu Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
91 5 920 925 930 



TTG TTA CAT GAA AAA ATC CCC ATT AAA GAC ATG CTC ACT ATT TTA GAA 1776 

Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
935 940 945 

ACG ATT ACC GAT ATT GCC CCA TTG GTT CAA AAC GAT GTG AAT ATC TTA 1824 

Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
950 955 960 

ACC GAA CAA GTG AGG GCG AGG CTT TCT AGG GTG ATC ACT AAC GCT TTT 1872 

Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
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965 970 975 

AAA TCT GAA GAC GGG CGT TTG AAA TTT TTA ACC TTT TCT ACC GAT AGC 192 0 

Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
980 985 990 

GAA CAA TTT TTG CTT AAT AAA TTG CGA GAA AAT GGC ACT TCT AAA AGT 1968 
Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
995 1000 1005 1010 

TTG CTG CTC AAT GTG GGC GAA TTG CAA AAA CTC ATT GAA GTG GTC TCT 2016 
Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu lie Glu Val Val Ser 
1015 1020 1025 

GAA GAG GCC ATG AAA GTC TTG CAA AAA GGG ATC GCT CCG GTG ATT TTG 20 64 

Glu Glu Ala Met Lys Val Leu Gin Lys Gly lie Ala Pro Val lie Leu 
1030 1035 1040 

ATC GTA GAG CCT AAT TTA AGA AAA GCT CTT TCC AAT CAA ATG GAG CAA 2112 
le Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
1045 1050 1055 

GCC AGG ATT GAT GTG ATC GTG CTA AGC CAT GCG GAA TTA GAT CCT AAC 2160 
Ala Arg lie Asp Val lie Val Leu Ser His Ala Glu Leu Asp Pro Asn 
1060 1065 1070 

TCT AAT TTT GAA GCT TTA GGC ACG ATC CAT ATT AAC TTT TAA 22 02 

Ser Asn Phe Glu Ala Leu Gly Thr He His He Asn Phe * 
1075 1080 1085 




(2) ANGABEN ZU SEQ ID NO: 52: 

(i) SEQUEN2KENNZEICHEN: 

(A) LANGE: 734 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 52: 

Met Ala Asn Glu Arg Ser Lys Leu Ala Phe Lys Lys Thr Phe Pro Val 
15 10 15 

he Lys Arg Phe Leu Gin Ser Lys Asp Leu Ala Leu Val Val Phe Val 
20 25 30 

He Ala He Leu Ala He He He Val Pro Leu Pro Pro Phe Val Leu 
35 40 45 

Asp Phe Leu Leu Thr He Ser He Ala Leu Ser Val Leu He He Leu 
50 55 60 

He Gly Leu Tyr He Asp Lys Pro Thr Asp Phe Ser Ala Phe Pro Thr 
65 70 75 80 

Leu Leu Leu He Val Thr Leu Tyr Arg Leu Ala Leu Asn Val Ala Thr 

85 90 95 



Thr Arg Met He Leu Thr Gin Gly Tyr Lys Gly Pro Ser Ala Val Ser 
100 105 110 
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Asp lie lie Thr Ala Phe Gly Glu Phe Ser Val Ser Gly Asn Tyr Val 
115 120 125 

He Gly Ala He He Phe Ser He Leu Val Leu Val Asn Leu Leu Val 
130 135 140 

Val Thr Asn Gly Ser Thr Arg Val Thr Glu Val Arg Ala Arg Phe Ala 
145 150 155 160 

Leu Asp Ala Met Pro Gly Lys Gin Met Ala He Asp Ala Asp Leu Asn 
165 170 175 

Ser Gly Leu He Asp Asp Lys Glu Ala Lys Lys Arg Arg Ala Ala Leu 
180 185 190 

Ser Gin Glu Ala Asp Phe Tyr Gly Ala Met Asp Gly Ala Ser Lys Phe 
195 200 205 

Val Lys Gly Asp Ala He Ala Ser He He He Thr Leu He Asn He 
210 215 220 

e Gly Gly Phe Leu Val Gly Val Phe Gin Arg Asp Met Ser Leu Ser 
25 230 235 240 

Phe Ser Ala Ser Thr Phe Thr He Leu Thr He Gly Asp Gly Leu Val 
245 250 255 

Gly Gin He Pro Ala Leu He He Ala Thr Ala Thr Gly He Val Ala 
260 265 270 

Thr Arg Thr Thr Gin Asn Glu Glu Glu Asp Phe Ala Ser Lys Leu He 
275 280 285 

Thr Gin Leu Thr Asn Lys Ser Lys Thr Leu Val He Val Gly Ala He 
290 295 300 

Leu Leu Leu Phe Ala Thr He Pro Gly Leu Pro Thr Phe Ser Leu Ala 
305 310 315 320 



Phe Val Gly Thr Leu Phe Leu Phe He Ala Trp Leu He Ser Arg Glu 
325 330 335 



y Lys Asp Gly Leu Leu Thr Lys Leu Glu Asn Tyr Leu Ser Gin Lys 
340 345 350 



he Gly Leu Asp Leu Ser Glu Lys Pro His Ser Ser Lys He Lys Pro 
355 360 365 

His Thr Pro Thr Thr Arg Ala Lys Thr Gin Glu Glu Leu Lys Arg Glu 
370 375 380 

Glu Glu Gin Ala He Asp Glu Val Leu Lys He Glu Phe Leu Glu Leu 
385 390 395 400 

Ala Leu Gly Tyr Gin Leu He Ser Leu Ala Asp Met Lys Gin Gly Gly 
405 410 415 

Asp Leu Leu Glu Arg He Arg Gly He Arg Lys Lys He Ala Ser Asp 
420 425 430 

Tyr Gly Phe Leu Met Pro Gin He Arg He Arg Asp Asn Leu Gin Leu 
435 440 445 
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Pro Pro Thr His Tyr Glu lie Lys Leu Lys Gly He Val lie Gly Glu 
450 455 460 

Gly Met Val Met Pro Asp Lys Phe Leu Ala Met Asn Thr Gly Phe Val 
465 470 475 480 

Asn Lys Glu He Glu Gly He Pro Thr Lys Glu Pro Ala Phe Gly Met 
485 490 495 

Asp Ala Leu Trp He Glu Thr Lys Asn Lys Glu Glu Ala He He Gin 
500 505 510 

Gly Tyr Thr He He Asp Pro Ser Thr Val He Ala Thr His Thr Ser 
515 520 525 

Glu Leu Val Lys Lys Tyr Ala Glu Asp Phe He Thr Lys Asp Glu Val 
530 535 540 

Lys Ser Leu Leu Glu Arg Leu Ala Lys Asp Tyr Pro Thr He Val Glu 
,45 550 555 560 

u Ser Lys Lys He Pro Thr Gly Ala He Arg Ser Val Leu Gin Ala 
565 570 575 

Leu Leu His Glu Lys He Pro He Lys Asp Met Leu Thr He Leu Glu 
580 585 590 

Thr He Thr Asp He Ala Pro Leu Val Gin Asn Asp Val Asn He Leu 
595 600 605 

Thr Glu Gin Val Arg Ala Arg Leu Ser Arg Val He Thr Asn Ala Phe 
610 615 620 

Lys Ser Glu Asp Gly Arg Leu Lys Phe Leu Thr Phe Ser Thr Asp Ser 
625 630 635 640 

Glu Gin Phe Leu Leu Asn Lys Leu Arg Glu Asn Gly Thr Ser Lys Ser 
645 650 655 

Leu Leu Leu Asn Val Gly Glu Leu Gin Lys Leu He Glu Val Val Ser 
660 665 670 

u Glu Ala Met Lys Val Leu Gin Lys Gly He Ala Pro Val He Leu 
675 680 685 

He Val Glu Pro Asn Leu Arg Lys Ala Leu Ser Asn Gin Met Glu Gin 
690 695 700 

Ala Arg He Asp Val He Val Leu Ser His Ala Glu Leu Asp Pro Asn 
70S 710 715 720 

Ser Asn Phe Glu Ala Leu Gly Thr He His He Asn Phe * 
725 730 

(2) ANGABEN ZU SEQ ID NO: 53: 

( i ) S EQUENZ KENNZ EI CHEN : 

(A) LANGE: 189 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 
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(vii) UNM I TTE LB ARE HERKUNFT: 

(B) CLON(E) : HPC157 (HPC181) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..189 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 53: 

ATG CAA AAA GAA CAA GAA GCC CGA GAA ATC GCT AAA AAA GCC GTT CAA 48 

Met Gin Lys Glu Gin Glu Ala Arg Glu lie Ala Lys Lys Ala Val Gin 
735 740 745 750 

ATC GTG TTT TTT TTA GGG ATT GTG GTG GTG CTT TTG ATG ATG ATA AAC 96 

lie Val Phe Phe Leu Gly He Val Val Val Leu Leu Met Met He Asn 
755 760 765 



T TAC ATG CTC ATC AAT CAA ATC AAC GCG AGC GCT AAA ATG AGC CAA 144 
u Tyr Met Leu He Asn Gin He Asn Ala Ser Ala Lys Met Ser Gin 
770 775 780 



CAA ATC AAA AAA ATA GAA GAA AGG CTT AAC CAA GGG CAA AAA TAG 189 
Gin He Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
785 790 795 



(2) ANGABEN ZU SEQ ID NO: 54: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 63 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 54: 



Met Gin Lys Glu Gin Glu Ala Arg Glu He Ala Lys Lys Ala Val Gin 
15 10 15 



le Val Phe Phe Leu Gly He Val Val Val Leu Leu Met Met He Asn 
20 25 30 



eu Tyr Met Leu He Asn Gin He Asn Ala Ser Ala Lys Met Ser Gin 
35 40 45 

Gin He Lys Lys He Glu Glu Arg Leu Asn Gin Gly Gin Lys * 
50 55 60 



(2) ANGABEN ZU SEQ ID NO: 55: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1008 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS183 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1008 



(xi) SEQUENZBESCHRE IBUNG : SEQ ID NO : 55: 

ATG TTA GTT ACT CGC TTT AAA AAA GCT TTC ATT TCT TAT TCT TTA GGC 4 8 

Met Leu Val Thr Arg Phe Lys Lys Ala Phe lie Ser Tyr Ser Leu Gly 
65 70 75 

GTG CTT GTC GCT TCA TTA TGG TTG AAC GTG TGC AAC GCT TCA GCG CAA 96 

Val Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
80 85 90 95 

GAA GTC AAA GTC AAG GAT TAT TTC GGG GAG CAA ACC ATC AAG CTT CCT 144 

Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr lie Lys Leu Pro 
100 105 110 



TT TCT AAA ATA GCC TAT ATA GGG AGC TAT GTA GAA GTG CCT GCC ATG 192 
1 Ser Lys lie Ala Tyr lie Gly Ser Tyr Val Glu Val Pro Ala Met 
115 120 125 



CTT AAT GTT TGG AAT AGG GTT GTA GGC GTT TCG GAT TAC GCT TTT AAA 240 
Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
. 130 135 140 

GAC GAT ATT GTC AAA GCC ACT CTC AAA GGC GAA GAT CTT AAA CGC GTC 2 88 

Asp Asp lie Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 
145 150 155 

AAA CAC ATG AGC ACT GAT CAT ACA GCC GCG CTA AAT GTA GAG CTT TTA 336 
Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
160 165 170 175 

AAA AAG CTT AGC CCT GAT CTT GTG GTA ACC TTT GTG GGC AAC CCT AAA 384 
Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
180 185 190 

GCG GTA GAG CAT GCG AAA AAA TTT GGT ATA TCA TTT CTT TCT TTT CAA 432 
Ala Val Glu His Ala Lys Lys Phe Gly lie Ser Phe Leu Ser Phe Gin 
195 200 205 




.G ACA ACG ATT GCA GAG GCC ATG CAG GCC ATG CAA GCT CAA GCC ACG 480 
u Thr Thr lie Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
210 215 220 



GTT TTA GAG ATT GAC GCT TCC AAA AAA TTC GCC AAA ATG CAA GAA ACT 528 
Val Leu Glu lie Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
225 230 235 

TTG GAT TTT ATT GCT GAG CGT TTG AAA AAT GTC AAA AAG AAA AAG GGG 576 
Leu Asp Phe lie Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
240 245 250 255 

GTG GAG CTT TTC CAT AAA GCC AAT AAA ATC AGC GGC CAT CAA GCC ATT 624 
Val Glu Leu Phe His Lys Ala Asn Lys lie Ser Gly His Gin Ala lie 
260 265 270 

AGC TCA GAC ATT TTA GAA AAA GGG GGC ATA GAC AAT TTT GGC TTG AAA 67 2 

Ser Ser Asp lie Leu Glu Lys Gly Gly lie Asp Asn Phe Gly Leu Lys 
275 280 285 
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TAT GTC AAA TTT GGG CGT GCT GAC ATT AGC GTG GAA AAA ATC GTT AAA 72 0 

Tyr Val Lys Phe Gly Arg Ala Asp lie Ser Val Glu Lys lie Val Lys 
290 295 300 

GAA AAC CCT GAG ATT ATC TTT ATT TGG TGG ATA AGC CCA CTC ACG CCT 768 
Glu Asn Pro Glu lie lie Phe He Trp Trp He Ser Pro Leu Thr Pro 
305 310 315 

GAA GAT GTG TTA AAC AAC CCC AAA TTT GCT ACC ATC AAA GCC ATT AAA 816 
Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr He Lys Ala He Lys 
320 325 330 335 

AAC AAG CAG GTT TAT AAA CTC CCC ACA ATG GAT ATT GGC GGG CCT AGA 864 
Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp He Gly Gly Pro Arg 
340 345 350 

GCC CCA CTC ATA AGT CTT TTT ATC GCT CTA AAA GCC CAC CCT GAA GCC 912 
Ala Pro Leu He Ser Leu Phe He Ala Leu Lys Ala His Pro Glu Ala 
355 360 365 

T AAG GGC GTG GAT ATT AAT GCG ATG GTT AAA GAC TAC TAT AAA GTG 960 
e Lys Gly Val Asp He Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
370 375 380 

GTT TTT GAT TTG AAT GAT GCA GAG GTT GAG CCC TTT TTA TGG CAT TAA 1008 
Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
385 390 395 



(2) ANGABEN ZU SEQ ID NO: 56: 

( i ) SEQUENZ KENNZ E I CHEN : 

(A) LANGE: 336 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 56: 

Met Leu Val Thr Arg Phe Lys Lys Ala Phe He Ser Tyr Ser Leu Gly 
1 5 10 15 

1 Leu Val Ala Ser Leu Trp Leu Asn Val Cys Asn Ala Ser Ala Gin 
20 25 30 

Glu Val Lys Val Lys Asp Tyr Phe Gly Glu Gin Thr He Lys Leu Pro 
35 40 45 

Val Ser Lys He Ala Tyr He Gly Ser Tyr Val Glu Val Pro Ala Met 
50 55 60 

Leu Asn Val Trp Asn Arg Val Val Gly Val Ser Asp Tyr Ala Phe Lys 
65 70 75 80 

Asp Asp He Val Lys Ala Thr Leu Lys Gly Glu Asp Leu Lys Arg Val 

85 90 95 

Lys His Met Ser Thr Asp His Thr Ala Ala Leu Asn Val Glu Leu Leu 
100 105 110 



Lys Lys Leu Ser Pro Asp Leu Val Val Thr Phe Val Gly Asn Pro Lys 
115 120 125 
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Ala Val Glu His Ala Lys Lys Phe Gly lie Ser Phe Leu Ser Phe Gin 
130 135 140 

Glu Thr Thr He Ala Glu Ala Met Gin Ala Met Gin Ala Gin Ala Thr 
14 $ 150 155 160 

Val Leu Glu He Asp Ala Ser Lys Lys Phe Ala Lys Met Gin Glu Thr 
165 170 175 

Leu Asp Phe He Ala Glu Arg Leu Lys Asn Val Lys Lys Lys Lys Gly 
180 185 190 

Val Glu Leu Phe His Lys Ala Asn Lys He Ser Gly His Gin Ala He 
195 200 205 

Ser Ser Asp He Leu Glu Lys Gly Gly He Asp Asn Phe Gly Leu Lys 
210 215 220 

Tyr Val Lys Phe Gly Arg Ala Asp He Ser Val Glu Lys He Val Lys 
I 25 230 235 240 

u Asn Pro Glu He He Phe He Trp Trp He Ser Pro Leu Thr Pro 
245 250 255 

Glu Asp Val Leu Asn Asn Pro Lys Phe Ala Thr He Lys Ala He Lys 
260 265 270 

Asn Lys Gin Val Tyr Lys Leu Pro Thr Met Asp He Gly Gly Pro Arg 
275 280 285 

Ala Pro Leu He Ser Leu Phe He Ala Leu Lys Ala His Pro Glu Ala 
290 295 300 

Phe Lys Gly Val Asp He Asn Ala Met Val Lys Asp Tyr Tyr Lys Val 
305 310 315 320 

Val Phe Asp Leu Asn Asp Ala Glu Val Glu Pro Phe Leu Trp His * 
325 330 335 



(2) ANGABEN ZU SEQ ID NO: 57: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 240 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS186 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE: 1 . .240 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 57: 



ATG GGC GGA TTC ACA AGC ATA TGG CAT TGG GTC ATT GTT TTA TTA GTG 
Met Gly Gly Phe Thr Ser He Trp His Trp Val He Val Leu Leu Val 
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340 345 350 

ATT GTG TTG TTA TTT GGG GCT AAA AAG ATC CCA GAA TTG GCT AAA GGT 96 
lie Val Leu Leu Phe Gly Ala Lys Lys lie Pro Glu Leu Ala Lys Gly 
355 360 365 

TTA GGC AGT GGG ATT AAG AAT TTC AAA AAA GCC GTG AAA GAC GAT GAA 144 
Leu Gly Ser Gly lie Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
370 375 380 

GAA GAG GCT AAA AAC GAG CCA AAA ACC CTA GAC GCT CAA GCA ACG CAA 192 
Glu Glu Ala Lys Asn Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
385 390 395 400 

ACC AAA GTG CAT GAG AGT AGC GAG ATT AAA AGC AAA CAA GAA AGT TAA 240 
Thr Lys Val His Glu Ser Ser Glu lie Lys Ser Lys Gin Glu Ser * 
405 410 415 



2) ANGABEN ZU SEQ ID NO: 58: 




( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 80 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 58: 

Met Gly Gly Phe Thr Ser lie Trp His Trp Val lie Val Leu Leu Val 
15 10 15 

lie Val Leu Leu Phe Gly Ala Lys Lys lie Pro Glu Leu Ala Lys Gly 
20 25 30 

Leu Gly Ser Gly lie Lys Asn Phe Lys Lys Ala Val Lys Asp Asp Glu 
35 40 45 

Glu Glu Ala Lys Asn Glu Pro Lys Thr Leu Asp Ala Gin Ala Thr Gin 
50 55 60 

Thr Lys Val His Glu Ser Ser Glu lie Lys Ser Lys Gin Glu Ser * 
5 , 70 75 80 



(2) ANGABEN ZU SEQ ID NO: 59: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1764 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS188 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .1764 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 59: 

ATG AAA AAC TTT TCC CCA CTT TGT TGT TTT AAA AAG CTC AAA AAA CGC 48 
Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 

85 90 95 

CAT TTA ATC GCT TTG AGC CTG CCC TTG CTT TCT TAT GCT AAT GGC TTT 96 
His Leu lie Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
100 105 110 

AAA ATC CAA GAG CAA AGC CTG AAT GGC ACG GCT TTA GGC TCG GCG TAT 144 
Lys lie Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
115 120 125 

GTC GCT G3G GCT AGG GGG GCT GAT GCT TCC TTT TAT AAC CCG GCG AAT 192 
Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
130 135 140 

ATG GGC TTT ACT AAC GAT TGG GAT GAA AAC AGA AGC GAA TTT GAA ATG 240 
et Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
5 150 155 160 

!CC ACC ACC GTG ATT AAT ATC CCG GCC TTT AAG TTT CAA GTC CCT ACG 288 
hr Thr Thr Val lie Asn lie Pro Ala Phe Lys Phe Gin Val Pro Thr 
165 170 175 

ACT AAT CAA GGC TTG TAT TCG GTT ACG AGC TTA CAA ATT GAT AAA AGC 336 
Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin lie Asp Lys Ser 
180 185 190 

CAA CAA AAT ATT TTA GGC ATC ATC AAC ACT ATA GGG CTT AGC AAT ATC 3 84 

Gin Gin Asn lie Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
195 200 205 

CTT AAA GCG CTT GGC AAT ACG GCC GCT ACC AAT GGC TTA TCA CAA GCA 432 
Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
210 215 220 

ATC AAT CGG GTT CAA GGG CTT ATG AAT CTA ACC AAT CAA AAA GTC GTA 480 
He Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
225 230 235 240 




# 



p CTC GCT TCA AAA CCT GAC ACC CAA ATC GTG AAT GGC TGG ACG GGA 52 8 

Leu Ala Ser Lys Pro Asp Thr Gin He Val Asn Gly Trp Thr Gly 
245 250 255 



ACG ACT AAT TTT GTT TTA CCC AAA TTC TTT TAT AAA ACG CGC ACG CAT 576 

Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 

260 265 270 

AAC GGC TTC ACT TTT GGG GGG AGT TTT ACC GCT CCT AGC GGG TTG GGC 62 4 

Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
275 280 285 

ATG AAA TGG AAT GGT AAA GGG GGG GAA TTT TTG CAT GAC GTG TTT ATC 672 

Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe He 
290 295 300 

ATG ATG GTA GAG CTT GCC CCT AGC ATG AGC TAT ACT GTT AAT AAG CAC 720 

Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 

305 310 315 320 
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TTT TCC GTG GGC GTG GGC TTA AGG GGG CTT TAT GCG ACC GGG AGC TTT 768 
Phe Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
325 330 335 

AAT AAC ACC GTT TAT GTG CCT TTA GAG GGC GCT TCG GTT TTG AGC GCG 816 
Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
340 345 350 

GAG CAA ATT TTA AAT TTA CCC AAC AAT GTT TTT GCC GAT CAA GTG CCA 864 
Glu Gin lie Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
355 360 365 

AGT AAC ATG ATG ACT TTA TTA GGC AAT ATT GGC TAC CAA CCA GCG CTT 912 
Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
370 375 380 

AAT TGC CAA AAA GCC GGT GGG GAT ATG AGC GAT CAG AGC TGT CAA GAG 960 
Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
385 390 395 400 

TT TAT AAC GGC TTG AAA AAA ATC ATG GGC TAT AGC GGC TTA ATC AAA 1008 
he Tyr Asn Gly Leu Lys Lys lie Met Gly Tyr Ser Gly Leu lie Lys 
405 410 415 

GCG AGC GCG AAT CTT TAT GGC ACG ACT CAA GTC GTG CAA AAA TCT AAC 1056 
Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
420 425 430 

GGG CAA GGC GTA TCG GGG GGC TAT AGA GTG GGT TCG AGT TTG CGT GTG 1104 
Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
435 440 445 

TTT GAT CAT GGC ATG TTT TCG GTG GTG TAT AAT TCT TCA GTT ACA TTC 1152 
Phe Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 
450 455 460 

AAT ATG AAA GGC GCT CTA GTG GCT ATC ACC GAG CTT GGC CCT TCT TTA 12 00 

Asn Met Lys Gly Ala Leu Val Ala lie Thr Glu Leu Gly Pro Ser Leu 
4 ^5 470 475 480 

GGG AGC GTT TTG ACT AAA GGC AGC TTG AAT ATC AAT GTT TCA CTC CCC 1248 
Gly Ser Val Leu Thr Lys Gly Ser Leu Asn lie Asn Val Ser Leu Pro 
485 490 495 



ACC CTA AGC CTA GCC TAC GCC CAC CAA TTT TTT AAA GAC CAT TTA 12 96 

In Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
500 505 510 

AGA ATA GAG GGG GTG TTT GAG CGT ACC TTT TGG AGT CAA GGG AAT AAA 1344 
Arg lie Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
515 520 525 

TTT TTA GTA ACC CCT GAT TTT GCG AAC GCT ACT TAC AAG GGC TTG AGC 13 92 

Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 
530 535 540 

GGA ACG GTG GCT TCA CTA GAC TCT GAG ACG CTT AAA AAA ATG GTA GGC 144 0 

Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 
545 550 555 560 

TTA GCG AAT TTT AAA AGC GTG ATG AAC ATG GGG GCT GGC TGG AGA GAC 14 88 

Leu Ala Ann Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 



91 




565 570 575 

ACC AAC ACC TTT AGA TTA GGG GTA ACT TAC ATG GGT AAA AGC TTG CGT 1536 
Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
580 585 590 

TTG ATG GGT GCT ATT GAT TAT GAC CAA GCC CCA AGC CCC CAA GAC GCG 1584 
Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
595 600 605 

ATA GGT ATC CCA GAT TCC AAT GGC TAT ACC GTG GCT TTT GGG ACT AAA 1632 
lie Gly lie Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
610 615 620 

TAC AAT TTT AGG GGC TTT GAT TTA GGC GTA GCG GGG AGT TTC ACT TTT 1680 
Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
625 630 635 640 

AAA AGC AAC CGC TCC AGT TTG TAT CAA TCC CCA AAC ATT GGG CAA TTG 1728 
Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn He Gly Gin Leu 
645 650 655 

GA ATC TTT AGC GCC TCT TTA GGC TAT CGC TGG TAA 1764 
Arg He Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
660 665 

(2) ANGABEN ZU SEQ ID NO: 60: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 588 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 60: 

Met Lys Asn Phe Ser Pro Leu Cys Cys Phe Lys Lys Leu Lys Lys Arg 
15 10 15 



His Leu He Ala Leu Ser Leu Pro Leu Leu Ser Tyr Ala Asn Gly Phe 
20 25 30 



s He Gin Glu Gin Ser Leu Asn Gly Thr Ala Leu Gly Ser Ala Tyr 
35 40 45 



Val Ala Gly Ala Arg Gly Ala Asp Ala Ser Phe Tyr Asn Pro Ala Asn 
50 55 60 

Met Gly Phe Thr Asn Asp Trp Asp Glu Asn Arg Ser Glu Phe Glu Met 
65 70 75 80 

Thr Thr Thr Val He Asn He Pro Ala Phe Lys Phe Gin Val Pro Thr 

85 90 95 

Thr Asn Gin Gly Leu Tyr Ser Val Thr Ser Leu Gin He Asp Lys Ser 
100 105 110 

Gin Gin Asn He Leu Gly He He Asn Thr He Gly Leu Ser Asn He 
115 120 125 

Leu Lys Ala Leu Gly Asn Thr Ala Ala Thr Asn Gly Leu Ser Gin Ala 
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130 135 140 

lie Asn Arg Val Gin Gly Leu Met Asn Leu Thr Asn Gin Lys Val Val 
145 150 155 160 

Thr Leu Ala Ser Lys Pro Asp Thr Gin lie Val Asn Gly Trp Thr Gly 
165 170 175 

Thr Thr Asn Phe Val Leu Pro Lys Phe Phe Tyr Lys Thr Arg Thr His 
180 185 190 

Asn Gly Phe Thr Phe Gly Gly Ser Phe Thr Ala Pro Ser Gly Leu Gly 
195 200 205 

Met Lys Trp Asn Gly Lys Gly Gly Glu Phe Leu His Asp Val Phe lie 
210 215 220 

Met Met Val Glu Leu Ala Pro Ser Met Ser Tyr Thr Val Asn Lys His 
225 230 235 240 

he Ser Val Gly Val Gly Leu Arg Gly Leu Tyr Ala Thr Gly Ser Phe 
245 250 255 

Asn Asn Thr Val Tyr Val Pro Leu Glu Gly Ala Ser Val Leu Ser Ala 
260 265 270 

Glu Gin lie Leu Asn Leu Pro Asn Asn Val Phe Ala Asp Gin Val Pro 
275 280 285 

Ser Asn Met Met Thr Leu Leu Gly Asn lie Gly Tyr Gin Pro Ala Leu 
290 295 300 

Asn Cys Gin Lys Ala Gly Gly Asp Met Ser Asp Gin Ser Cys Gin Glu 
305 310 315 320 

Phe Tyr Asn Gly Leu Lys Lys lie Met Gly Tyr Ser Gly Leu lie Lys 
325 330 335 

Ala Ser Ala Asn Leu Tyr Gly Thr Thr Gin Val Val Gin Lys Ser Asn 
340 345 350 



Gly Gin Gly Val Ser Gly Gly Tyr Arg Val Gly Ser Ser Leu Arg Val 
355 360 365 



e Asp His Gly Met Phe Ser Val Val Tyr Asn Ser Ser Val Thr Phe 

370 375 380 

Asn Met Lys Gly Ala Leu Val Ala lie Thr Glu Leu Gly Pro Ser Leu 
385 390 395 400 

Gly Ser Val Leu Thr Lys Gly Ser Leu Asn lie Asn Val Ser Leu Pro 
405 410 415 

Gin Thr Leu Ser Leu Ala Tyr Ala His Gin Phe Phe Lys Asp His Leu 
420 425 430 

Arg lie Glu Gly Val Phe Glu Arg Thr Phe Trp Ser Gin Gly Asn Lys 
435 440 445 

Phe Leu Val Thr Pro Asp Phe Ala Asn Ala Thr Tyr Lys Gly Leu Ser 

450 455 460 
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Gly Thr Val Ala Ser Leu Asp Ser Glu Thr Leu Lys Lys Met Val Gly 
465 470 475 480 

Leu Ala Asn Phe Lys Ser Val Met Asn Met Gly Ala Gly Trp Arg Asp 
485 490 495 

Thr Asn Thr Phe Arg Leu Gly Val Thr Tyr Met Gly Lys Ser Leu Arg 
500 505 510 

Leu Met Gly Ala lie Asp Tyr Asp Gin Ala Pro Ser Pro Gin Asp Ala 
515 520 525 

lie Gly lie Pro Asp Ser Asn Gly Tyr Thr Val Ala Phe Gly Thr Lys 
530 535 540 

Tyr Asn Phe Arg Gly Phe Asp Leu Gly Val Ala Gly Ser Phe Thr Phe 
545 550 555 560 

Lys Ser Asn Arg Ser Ser Leu Tyr Gin Ser Pro Asn lie Gly Gin Leu 
565 570 575 

g lie Phe Ser Ala Ser Leu Gly Tyr Arg Trp * 
580 585 

(2) ANGABEN ZU SEQ ID NO: 61: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1443 Basenpaare 
<B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS190 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1443 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 61: 



G GAA TTG AAA AAA ATC GCC CTT ATT TTA GAT GGC ATT GTA GCA AAA 48 
eu Glu Leu Lys Lys lie Ala Leu lie Leu Asp Gly lie Val Ala Lys 
590 595 600 

AAT TTT TTA GAC TTG GTG CTA AGG CAT TAT TCT AAT CAT AAT TTT TAT 96 
Asn Phe Leu Asp Leu Val Leu Arg His Tyr Ser Asn His Asn Phe Tyr 
605 610 615 620 

ATA GTG GTT GTC AAA AAT GAG AGC CTT ATC CCT AAA AAT TAC CCG AGC 144 
lie Val Val Val Lys Asn Glu Ser Leu lie Pro Lys Asn Tyr Pro Ser 
625 630 635 

ACT TTC GCT TTT TAT TGT TTT GAT GCG ACT TCT AGT TTC AGG CTT TTG 192 
Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu 
640 645 650 

CAA GTG TTA AAC GAT GAG GTG AGC GAT GCG TTT TTA ATC ATA CAA GAT 24 0 

Gin Val Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp 
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655 660 665 

TTT AAA GAA CAG CGC ATC ATT CAT AAA ATC ATT CAA ACC CAT TTC AAA 288 
Phe Lys Glu Gin Arg lie lie His Lys lie lie Gin Thr His Phe Lys 
670 675 680 

CGC ATG CGC GTG GTT TTG AGC GTG AAA AAA GAT GGT GAA AAA ACT TTA 336 
Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
685 690 695 700 

GAA AAT AAT GAA GAA AAT AAA GAT GAA AAG CTT ATT TTG ATT GAT GAA 384 
Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu lie Leu lie Asp Glu 
705 710 715 

TTT GAA GTT TTA GCC AAT AAA TTC ATT TCT CGT TTG CCT AAT ATC CCT 432 
Phe Glu Val Leu Ala Asn Lys Phe lie Ser Arg Leu Pro Asn lie Pro 
720 725 730 



AGC ACC CCT AGA GAA TTT GGG TTA GCC AAA GGC GAG ATC ATG GAG ATT 4 80 

er Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu lie Met Glu lie 
735 740 745 




TAT GTG CCT TTT GGG AGT ATT TTT CCT TAC AGG CAT ATT GGC TCT ATC 52 8 

Asp Val Pro Phe Gly Ser lie Phe Pro Tyr Arg His lie Gly Ser lie 
750 755 760 

AGC CAA CAA GAA TAC AGG ATT GTA GGG CTT TAT CGC AAC GAT GTT TTG 576 
Ser Gin Gin Glu Tyr Arg lie Val Gly Leu Tyr Arg Asn Asp Val Leu 
765 770 775 780 

TTG CTC TCC ACT AAA TCT TTA GTT ATC CAG CCA CGA GAC ATT CTT TTA 624 
Leu Leu Ser Thr Lys Ser Leu Val lie Gin Pro Arg Asp lie Leu Leu 
785 790 795 

GTG GCG GGT AAT CCG GAA ATT TTA AAC GCG GTG TAT CTT CAG GTC AAA 672 
Val Ala Gly Asn Pro Glu lie Leu Asn Ala Val Tyr Leu Gin Val Lys 
800 805 810 

AGC AAT GTC GGG CAG TTC CCA GCC CCC TTT GGT AAG AGC ATT TAT TTA 720 
Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser lie Tyr Leu 
815 820 825 

C ATT GAT ATG CGC TTA CCA AAG CCG AAA GCA ATG ATG CCC GAT GTG 768 
r lie Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
830 835 840 

TAT CAA GCC TTG TTT TTG CAC AAA CAT TTA AAG AGC TAC AAG CTC TAC 816 
Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
845 850 855 860 

ATT CAG GTT TTA CAC CCC ACT AGC CCT AAG TTT TGC CAT AAA TTT TTA 864 
lie Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
865 870 875 

TCG CTA GAA ACC GAA AGC ATT GAA GTG AAT TTT GAT TTT TAT GGG AAA 912 
Ser Leu Glu Thr Glu Ser lie Glu Val Asn Phe Asp Phe Tyr Gly Lys 
880 885 890 

AGT TTT ATC CAA AAA CTC CAT GAA GAC CAC CAG AAA AAA ATG GGT TTG 960 
Ser Phe lie Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
895 900 905 
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ATT GTG GTA GGC AGA GAG CTT TTT TTA TCT AAA AAA CAC CGA AAA GCC 1008 
lie Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
910 915 920 

CTA TAT AAA ACA GCC ACC CCG GTT TAT AAA ACC AAC ACT TCC GGC TTG 1056 
Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
925 930 935 940 

TCT AAA ACC TCT CAA AGC GTG GTG GTG TTG AAT GAA AGC TTG GAT ATC 1104 
Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp He 
945 950 955 

AAT GAG GAC ATG TCT TCA GTG ATC TTT GAT GTG TCT ATG CAA ATG GAT 1152 
Asn Glu Asp Met Ser Ser Val He Phe Asp Val Ser Met Gin Met Asp 
960 965 970 

TTG GGC TTG TTG CTC TAT GAT TTT GAC CCT AAC AAG CGC TAT AAA AAC 1200 
Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
975 980 985 

,G ATT GTC AAT CAT TAT GAA AAT TTA GCC AAC ACG CTC AAC CGC AAG 1248 
llu He Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
990 995 1000 

ATT GAG ATT TTT CAA ACC GAT ATT AGA AAT CCT ATC ATG TAT CTC AAT 12 96 

He Glu He Phe Gin Thr Asp He Arg Asn Pro He Met Tyr Leu Asn 
1005 1010 1015 1020 

TCT TTA AGA AAT CCC ATT TTG CAT TTC. ATG CCT TTT GAA GAG TGC ATC 1344 
Ser Leu Arg Asn Pro He Leu His Phe Met Pro Phe Glu Glu Cys He 
1025 1030 1035 

ACG CAC ACG CGC TTT TGG TGG TTT TTA TCC ACT AAA GTG GAA AAA TTA 13 92 

Thr His Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
1040 1045 1050 

GCG TTT TTA AAC GAT GAT AAC CCT CAA ATT TTT ATC CCT GTA GCG GAG 144 0 

Ala Phe Leu Asn Asp Asp Asn Pro Gin He Phe He Pro Val Ala Glu 
1055 1060 1065 



TGA 




(2) ANGABEN ZU SEQ ID NO: 62: 



( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 4 81 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 62 



Leu Glu Leu Lys Lys He Ala Leu He Leu Asp Gly He Val Ala Lys 
1 5 10 15 

Asn Phe Leu Asp Leu Val Leu Arg His Tyr Ser Asn His Asn Phe Tyr 
20 25 30 

lie Val Val Val Lyo Asn Glu Ser Leu He Pro Lys Asn Tyr Pro Ser 



1443 



96 




35 40 45 

Thr Phe Ala Phe Tyr Cys Phe Asp Ala Thr Ser Ser Phe Arg Leu Leu 
50 55 60 

Gin Val Leu Asn Asp Glu Val Ser Asp Ala Phe Leu lie lie Gin Asp 
65 70 75 80 

Phe Lys Glu Gin Arg lie lie His Lys lie He Gin Thr His Phe Lys 
85 90 95 

Arg Met Arg Val Val Leu Ser Val Lys Lys Asp Gly Glu Lys Thr Leu 
100 105 110 

Glu Asn Asn Glu Glu Asn Lys Asp Glu Lys Leu He Leu He Asp Glu 
115 120 125 

Phe Glu Val Leu Ala Asn Lys Phe He Ser Arg Leu Pro Asn He Pro 
130 135 140 

r Thr Pro Arg Glu Phe Gly Leu Ala Lys Gly Glu He Met Glu He 
5 150 155 160 

Asp Val Pro Phe Gly Ser He Phe Pro Tyr Arg His He Gly Ser He 
165 170 175 

Ser Gin Gin Glu Tyr Arg He Val Gly Leu Tyr Arg Asn Asp Val Leu 
180 185 190 

Leu Leu Ser Thr Lys Ser Leu Val He Gin Pro Arg Asp He Leu Leu 
195 200 205 

Val Ala Gly Asn Pro Glu He Leu Asn Ala Val Tyr Leu Gin Val Lys 
210 215 220 

Ser Asn Val Gly Gin Phe Pro Ala Pro Phe Gly Lys Ser He Tyr Leu 
225 230 235 240 

Tyr He Asp Met Arg Leu Pro Lys Pro Lys Ala Met Met Pro Asp Val 
245 250 255 

Tyr Gin Ala Leu Phe Leu His Lys His Leu Lys Ser Tyr Lys Leu Tyr 
260 265 270 

e Gin Val Leu His Pro Thr Ser Pro Lys Phe Cys His Lys Phe Leu 
275 280 285 

Ser Leu Glu Thr Glu Ser He Glu Val Asn Phe Asp Phe Tyr Gly Lys 
290 295 300 

Ser Phe He Gin Lys Leu His Glu Asp His Gin Lys Lys Met Gly Leu 
305 310 315 320 

He Val Val Gly Arg Glu Leu Phe Leu Ser Lys Lys His Arg Lys Ala 
325 330 335 

Leu Tyr Lys Thr Ala Thr Pro Val Tyr Lys Thr Asn Thr Ser Gly Leu 
340 345 350 

Ser Lys Thr Ser Gin Ser Val Val Val Leu Asn Glu Ser Leu Asp He 
355 360 365 
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Asn Glu Asp Met Ser Ser Val lie Phe Asp Val Ser Met Gin Met Asp 
370 375 380 

Leu Gly Leu Leu Leu Tyr Asp Phe Asp Pro Asn Lys Arg Tyr Lys Asn 
385 390 395 400 

Glu lie Val Asn His Tyr Glu Asn Leu Ala Asn Thr Leu Asn Arg Lys 
405 410 415 

lie Glu lie Phe Gin Thr Asp lie Arg Asn Pro lie Met Tyr Leu Asn 
420 425 430 

Ser Leu Arg Asn Pro lie Leu His Phe Met Pro Phe Glu Glu Cys lie 
435 440 445 

Thr *Tis Thr Arg Phe Trp Trp Phe Leu Ser Thr Lys Val Glu Lys Leu 
-=50 455 460 

Ala Phe Leu Asn Asp Asp Asn Pro Gin lie Phe lie Pro Val Ala Glu 
5 470 475 480 



(2) ANGABEN ZU SEQ ID NO: 63: 

(i) S EQUENZ KENNZ E I CHEN : 

(A) LANGE : 543 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 




(vii) UNM I TTE LB ARE HERKUNFT : 

(B) CLON(E) : HPC008 (HPC114 r HPC145) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..543 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 63: 

'G AAA AGC ATG CGT TTT AGC TAT ATT GAG CCA AGA GCG AAA TAC CTT 4 8 

Met Lys Ser Met Arg Phe Ser Tyr lie Glu Pro Arg Ala Lys Tyr Leu 
485 490 495 

ATC AGC AAG CTT TCT AAA ATT TGG GTT TTT TAC ATT TTT TTA TCT TTT 96 
lie Ser Lys Leu Ser Lys lie Trp Val Phe Tyr lie Phe Leu Ser Phe 
500 505 510 

GTG GTG ATA GGG GGG TTA GTG TGG TTT ATG CAC AAC GCC ATT AAA AGC 144 
Val Val lie Gly Gly Leu Val Trp Phe Met His Asn Ala lie Lys Ser 
515 520 525 

ACT CAA GAC AAC GCG TCC AGT TTG ACG ATC CAA GAA AGG CTC TAC CGC 192 
Thr Gin Asp Asn Ala Ser Ser Leu Thr lie Gin Glu Arg Leu Tyr Arg 
530 535 540 545 



CAT GAA ATC ATC CGC TTA CAG GTT AAG ACT GAT GAA ACC TTA AAA CTC 24 0 

His Glu lie lie Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 
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550 555 560 

ATT AAA GAA GCC AAA AAG CGT TTG AAT TAT AAC GAT GAT ATA CGA GAT 288 
lie Lys Glu Ala Lys Lys Arg Leu Asn Tyr Asn Asp Asp lie Arg Asp 
565 570 575 

GTT TTG CAA GGG CTT TTG AAT ATT GTG CCG GAT TCC ATC ACT ATT AAT 336 
Val Leu Gin Gly Leu Leu Asn lie Val Pro Asp Ser lie Thr lie Asn 
580 585 590 

AGC ATT GAA ATA GAC GAG CAA AGC GTA GTG GTT AGT GGT AAA ACC CCT 3 84 

Ser lie Glu lie Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
595 600 605 

TCT AAA GAA GCC TTT TAT TTT TTG TTT CAA AAC AAA CTA AAC CCC ATG 4 32 

Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
610 615 620 625 



TTT GAT TAT TCT AGG GCG GAA TTT TTC CCT TTA AGC GAC GGG TGG TTT 4 80 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
^ 630 635 640 



T TTT GTC TCC ACC AAC TTT TCT AAT TCC TTA CTG ATA AAA AAT CCG 528 
Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu He Lys Asn Pro 
645 650 655 

GAG TCT ATT AAA TGA 543 
Glu Ser He Lys * 
660 



(2) ANGABEN ZU SEQ ID NO: 64: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 181 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 64: 



Met Lys Ser Met Arg Phe Ser Tyr He Glu Pro Arg Ala Lys Tyr Leu 
^ 15 10 15 



e Ser Lys Leu Ser Lys He Trp Val Phe Tyr He Phe Leu Ser Phe 

20 25 30 

Val Val He Gly Gly Leu Val Trp Phe Met His Asn Ala He Lys Ser 

35 40 45 

Thr Gin Asp Asn Ala Ser Ser Leu Thr He Gin Glu Arg Leu Tyr Arg 

50 55 60 

His Glu He lie Arg Leu Gin Val Lys Thr Asp Glu Thr Leu Lys Leu 

65 70 75 80 

He Lys Glu Ala Lys Lys Arg Leu Asn Tyr Asn Asp Asp He Arg Asp 

85 90 95 

Val Leu Gin Gly Leu Leu Asn He Val Pro Asp Ser He Thr He Asn 

100 105 110 
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Ser lie Glu lie Asp Gin Gin Ser Val Val Val Ser Gly Lys Thr Pro 
115 120 125 

Ser Lys Glu Ala Phe Tyr Phe Leu Phe Gin Asn Lys Leu Asn Pro Met 
130 135 140 

Phe Asp Tyr Ser Arg Ala Glu Phe Phe Pro Leu Ser Asp Gly Trp Phe 
145 150 155 160 

Asn Phe Val Ser Thr Asn Phe Ser Asn Ser Leu Leu lie Lys Asn Pro 
165 170 175 

Glu Ser lie Lys * 
180 

(2) ANGABEN ZU SEQ ID NO: 65: 

(i) S E QUENZ KENNZE I CHEN : 

(A) LANGE: 174 6 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS013 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1746 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 65: 

ATG AAA AAA TTG GTT TTA GTC ATC TTT TTA ACG CTA GCG CTT TCA ATA 48 
Met Lys Lys Leu Val Leu Val lie Phe Leu Thr Leu Ala Leu Ser lie 
185 190 195 

TCT GCA AAA GAA GTC AAA ATA GTG TTT TTA GAA ACT TCA GAC ATT CAT 96 
Ser Ala Lys Glu Val Lys lie Val Phe Leu Glu Thr Ser Asp lie His 
200 205 210 



CGG CTT TTT TCG TAT GAT TAT GCG ATT GGC GAG CAA AAA CCC AAT 144 

y Arg Leu Phe Ser Tyr Asp Tyr Ala lie Gly Glu Gin Lys Pro Asn 

215 220 225 

AAC GGC TTG ACA AGG ATT GCG ACT TTA ATC AAA AAG CAA AGG GCT GAG 192 

Asn Gly Leu Thr Arg He Ala Thr Leu He Lys Lys Gin Arg Ala Glu 

230 235 240 245 

AAT AAA AAT GTG GTT TTG ATT GAC AGC GGG GAT TTG TTG CAA GGC AAT 24 0 

Asn Lys Asn Val Val Leu He Asp Ser Gly Asp Leu Leu Gin Gly Asn 

250 255 260 

AGC GCG GAG TTG TTT AAT GAT GAG CCA ATT CAT CCG CTA GTT AGA GCT 2 88 

Ser Ala Glu Leu Phe Asn Asp Glu Pro He His Pro Leu Val Arg Ala 

265 270 275 

GAA AAC GAT TTG AAA TTT GAC ATT CGT GTG CTT GGC AAT CAC GAG TTT 33 6 

Glu Asn Aop Leu Lyo Phe Asp He Arg Val Leu Gly Asn His Glu Phe 

280 285 290 
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AAT TTC AGT AAA GAT TTT TTA GAA AAG AAT ATT AAG GGG TTT AAT GGC 3 84 

Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn lie Lys Gly Phe Asn Gly 
295 300 305 

GAT GTC ATG AAT GGG AAT ATC ATT AAA ATT GCG GAC AAT AAG CCG TTT 432 
Asp Val Met Asn Ala Asn lie lie Lys lie Ala Asp Asn Lys Pro Phe 
310 315 320 325 

GTA AAA CCT TAT ATT ATT AAA AAA ATT GAT GGC GTG AGG GTG GCG GTT 4 80 

Val Lys Pro Tyr lie lie Lys Lys lie Asp Gly Val Arg Val Ala Val 
330 335 340 

GTG GGG TAT GTG GTG GCG CAC ATC CCA ACT TGG GAG GCC TCT ACG CCT 52 8 

Val Gly Tyr Val Val Ala His lie Pro Thr Trp Glu Ala Ser Thr Pro 
345 350 355 

GAA CAT TTT GCA GGA TTG AAG TTT TTG GAC GCT GAA GAA GCG TTA AAA 576 
Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
360 365 370 



G ACC TTA QAG TTG AAA AAG TAT GAT ATT TTG ATT GGC GCT 624 

s Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp lie Leu lie Gly Ala 
375 380 385 




TTT CAT TTG GGG CGA GAA GAT GAG AAA GGT GGC GAC GGG ATA CCG GAT 672 
Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly lie Pro Asp 
390 395 400 405 

TTA GCG AAA AAA TTC CCG CAA TTT GAC ATC ATT TTT GCA GGG CAT GAG 72 0 

Leu Ala Lys Lys Phe Pro Gin Phe Asp lie lie Phe Ala Gly His Glu 
410 415 420 

CAT GCG GTT TAT AAC ACC AAA GTA GGG AAA GTG CAT ACC ATT GAG CCT 768 
His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr lie Glu Pro 
425 430 435 

GGA GCG TAT GGG GCT TAT CTG GCA AAG GGC GTG GTG GTA TTT GAC ACT 816 
Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
440 445 450 

AAA ACG AAG AAA AAA ATT ATA ACG ACT GAA AAT TTA CCC ACA AAA GAT 864 
Lys Thr Lys Lys Lys lie lie Thr Thr Glu Asn Leu Pro Thr Lys Asp 
455 460 465 

rTG CCA GAA GAT GAA GAA TTA GCG AAA AAA TAC GAA TAT GTG GAT AAA 912 
Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
470 475 480 485 

AAA TCA AAA GAA TAC GCT AAT GAA GTG GTT GGC GAA GTT ACA AAA ACC 960 
Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
490 495 500 

TTT ATT GAC AGG CCT GAT TTT ATC ACA GGA GAA GAA AAA ATC ACC ACG 100 8 

Phe lie Asp Arg Pro Asp Phe lie Thr Gly Glu Glu Lys He Thr Thr 
505 510 515 

ATG CCC ACC GCC GCC TTG CAA GAA ACA CCG GTG ATA GAA TTG ATT AAT 1056 
Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
520 525 530 

AAA GTG CAA AAA TAT TAC GCA AAA GCC GAT GTT TCA GCG GCA GCC TTA 1104 
Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 
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535 540 545 

TTC AAT TTT GGG GCG AAT TTG AAA AAA GGG CCT TTC AAA AGA AAA GAT 1152 
Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
550 555 560 565 

GTC ACT TAT ATT TAC AAG TTC GCT AAT ACG CTC ATT GGA GTG CGT ATA 12 00 

Val Thr Tyr lie Tyr Lys Phe Ala Asn Thr Leu lie Gly Val Arg lie 
570 575 580 

ACG GGT GAA AAT CTG TTG AAA TAC ATG GAA TGG TCA TAC CGA TTT TAC 1248 
Thr Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
585 590 595 

AAT CAG TTG CAA CCA GGA GAT TTG ACG ATC AGT TTT AAT GAA AAC ATT 1296 
Asn Gin Leu Gin Pro Gly Asp Leu Thr lie Ser Phe Asn Glu Asn lie 
600 605 610 

CGC GGC TAT AAC TTT GAT ATG TTT TCT GGC GTG AAA TAC CAG GTT GAT 1344 
g Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
615 620 625 

T ACA AAA CCC GCC GGA CAA AGG ATT ATC AAT CCG ACA ATC AAC AAC 1392 
Val Thr Lys Pro Ala Gly Gin Arg lie lie Asn Pro Thr He Asn Asn 
630 635 640 645 

AAA CCC ATT GAC CCC AAA GCC ATC TAT AAA TTA GCG ATC AAC AAT TAC 1440 
Lys Pro He Asp Pro Lys Ala He Tyr Lys Leu Ala He Asn Asn Tyr 
650 655 660 

CGA TTC GGA ACA TTA TCC ACG ACA TTG AAT TTG GTT ACA GAC GCT GAT 1488 
Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
665 670 675 

AGG TAT TAT AAT TCT TAC GAT GAA CTG CAA GAT AAT GGG CAA ATA CGA 1536 
Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin He Arg 
680 685 690 

GAT TTG ATC ATC AAA TAC ATC ACG GAA GAA AAA GGT GGG AAG GTA ACC 1584 
Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
695 700 705 



• 



T GAA TTG GAG GGT AAT TGG GAA ATC ATC AAC TAC GAT TTC AAA AAC 1632 

Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
0 715 720 725 



CCG TTG TTG GAA AAA TTG AGA GAA AAA TTA AAA GAG GGG AGC ATC AAA 1680 
Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
730 735 740 

ATC CCC ACC TCA AAG GAT GGG AGG ACT TTG AAT GTC AAA TCC ATT AAA 1728 
He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser lie Lys 
745 750 755 

GAG AGT GAA GTT AAA TAA 1746 
Glu Ser Glu Val Lys * 
760 



(2) ANGABEN ZU SEQ ID NO: 66: 
( i ) SEQUENZKENNZEICHEN : 



102 



(A) LANGE: 582 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 66: 

Met Lys Lys Leu Val Leu Val lie Phe Leu Thr Leu Ala Leu Ser lie 
15 10 15 

Ser Ala Lys Glu Val Lys lie Val Phe Leu Glu Thr Ser Asp lie His 
20 25 30 

Gly Arg Leu Phe Ser Tyr Asp Tyr Ala lie Gly Glu Gin Lys Pro Asn 
35 40 45 

Asn Gly Leu Thr Arg lie Ala Thr Leu lie Lys Lys Gin Arg Ala Glu 
50 55 60 



sn Lys Asn Val Val Leu lie Asp Ser Gly Asp Leu Leu Gin Gly Asn 
5 70 75 80 




er Ala Glu Leu Phe Asn Asp Glu Pro lie His Pro Leu Val Arg Ala 
85 90 95 

Glu Asn Asp Leu Lys Phe Asp lie Arg Val Leu Gly Asn His Glu Phe 
100 105 110 

Asn Phe Ser Lys Asp Phe Leu Glu Lys Asn lie Lys Gly Phe Asn Gly 
115 120 125 

Asp Val Met Asn Ala Asn lie lie Lys lie Ala Asp Asn Lys Pro Phe 
130 135 140 

Val Lys Pro Tyr lie lie Lys Lys lie Asp Gly Val Arg Val Ala Val 
145 150 155 160 

Val Gly Tyr Val Val Ala His He Pro Thr Trp Glu Ala Ser Thr Pro 
165 170 175 

Glu His Phe Ala Gly Leu Lys Phe Leu Asp Ala Glu Glu Ala Leu Lys 
180 185 190 

s Thr Leu Lys Glu Leu Lys Gly Lys Tyr Asp He Leu He Gly Ala 
195 200 205 

Phe His Leu Gly Arg Glu Asp Glu Lys Gly Gly Asp Gly He Pro Asp 
210 215 220 

Leu Ala Lys Lys Phe Pro Gin Phe Asp He He Phe Ala Gly His Glu 
225 230 235 240 

His Ala Val Tyr Asn Thr Lys Val Gly Lys Val His Thr He Glu Pro 
245 250 255 

Gly Ala Tyr Gly Ala Tyr Leu Ala Lys Gly Val Val Val Phe Asp Thr 
260 265 270 

Lys Thr Lys Lys Lys He He Thr Thr Glu Asn Leu Pro Thr Lys Asp 
275 280 285 

Val Pro Glu Asp Glu Glu Leu Ala Lys Lys Tyr Glu Tyr Val Asp Lys 
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290 295 300 

Lys Ser Lys Glu Tyr Ala Asn Glu Val Val Gly Glu Val Thr Lys Thr 
305 310 315 320 

Phe lie Asp Arg Pro Asp Phe lie Thr Gly Glu Glu Lys lie Thr Thr 
325 330 335 

Met Pro Thr Ala Ala Leu Gin Glu Thr Pro Val He Glu Leu He Asn 
340 345 350 

Lys Val Gin Lys Tyr Tyr Ala Lys Ala Asp Val Ser Ala Ala Ala Leu 
355 360 365 

Phe Asn Phe Gly Ala Asn Leu Lys Lys Gly Pro Phe Lys Arg Lys Asp 
370 375 380 

Val Thr Tyr He Tyr Lys Phe Ala Asn Thr Leu He Gly Val Arg He 
385 390 395 400 

r Gly Glu Asn Leu Leu Lys Tyr Met Glu Trp Ser Tyr Arg Phe Tyr 
405 410 415 

Asn Gin Leu Gin Pro Gly Asp Leu Thr He Ser Phe Asn Glu Asn He 
420 425 430 

Arg Gly Tyr Asn Phe Asp Met Phe Ser Gly Val Lys Tyr Gin Val Asp 
435 440 445 

Val Thr Lys Pro Ala Gly Gin Arg He He Asn Pro Thr He Asn Asn 
450 455 460 

Lys Pro He Asp Pro Lys Ala He Tyr Lys Leu Ala He Asn Asn Tyr 
465 470 475 480 

Arg Phe Gly Thr Leu Ser Thr Thr Leu Asn Leu Val Thr Asp Ala Asp 
485 490 495 

Arg Tyr Tyr Asn Ser Tyr Asp Glu Leu Gin Asp Asn Gly Gin He Arg 
500 505 510 



Asp Leu He He Lys Tyr He Thr Glu Glu Lys Gly Gly Lys Val Thr 
515 520 525 



o Glu Leu Glu Gly Asn Trp Glu He He Asn Tyr Asp Phe Lys Asn 
530 535 540 

Pro Leu Leu Glu Lys Leu Arg Glu Lys Leu Lys Glu Gly Ser He Lys 
545 550 555 560 

He Pro Thr Ser Lys Asp Gly Arg Thr Leu Asn Val Lys Ser He Lys 
565 570 575 

Glu Ser Glu Val Lys * 
580 

(2) ANGABEN ZU SEQ ID NO: 67: 

( i ) SEOUENZKENNZEICHEN : 

(A) LANGE: 1698 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM: be ides 
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(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 

(B) CLON(E) : HPS024 (HPS025) 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1698 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 67: 

ATG ATG TTT TCT TCA ATG TTT GCT TCG TTG GGG ACT CGT ATC ATG CTG 48 
Met Met Phe.Ser Ser Met Phe Ala Ser Leu Gly Thr Arg lie Met Leu 
585 590 595 

GTC GTG TTA GCC GCT CTT TTA GGT TTA GGG GGG CTT TTT ATT GGT TTT 96 
^al Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe lie Gly Phe 
600 605 610 

rTA AAG GTT ATG CAA AAA GAT GTG TTA GCG CAA CTC ATG GAG CAT TTA 144 
Val Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
615 620 625 630 

GAA ACC GGG CAA TAC AAA AAG CGT GAA AAA ACG CTC GCT TAC ATG ACA 192 
Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
635 640 645 

AAA ATT ATT GAA CAG GGC ATT CAT GAG TAT TAC AAA AAT TTT GAC AAT 240 
Lys lie lie Glu Gin Gly lie His Glu Tyr Tyr Lys Asn Phe Asp Asn 
650 655 660 

GCT ACT GCA AGA AAA ATG GCG TTA GAT TAT TTC AAA CGC ATC AAC GAC 288 
Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg lie Asn Asp 
665 670 675 

GAT AAG GGC ATG ATT TAT ATG GTG GTG GTG GAT AAA AAC GGG GTG GTA 336 
Asp Lys Gly Met lie Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
680 685 690 

G TTT GAT CCG GTC AAT CCT AAA ACC GTA GGC CAA TCA GGG CTT GAC 3 84 

u Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
5 700 705 710 

GCT CAG AGC GTT GAT GGG GTG TAT TAT GTT AGG GGG TAT TTG GAG GCG 432 
Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
715 720 725 

GCC AAA AAA GGG GGA GGC TAC ACT TAT TAT AAA ATG CCT AAA TAC GAT 4 80 

Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
730 735 740 

GGA GGC GTA CCG GAG AAA AAA TTC GCC TAC TCG CAT TAT GAT GAA GTT 52 8 

Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
745 750 755 

TCT CAA ATG GTG ATC GCA ACG ACT TCC TAT TAC ACT GAC ATT AAC ACA 576 
Ser Gin Met Val lie Ala Thr Thr Ser Tyr Tyr Thr Asp lie Asn Thr 
760 765 770 
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GAA AAT AAA GCG ATC AAA GAA GGC GTG AAT AAG GTT TTT GAT GAA AAC 624 
Glu Asn Lys Ala He Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
775 780 785 790 

ACC ACG AAA TTA TTC CTT TGG ATA CTG ACA GCG ACG ATA GCG CTA GTG 672 
Thr Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
795 800 805 

GTT TTG ACG CTC ATA TAC GCT AAA TTA AGG ATC GTG AAA CGC ATT GAT 720 
Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
810 815 820 

GAA CTG GTC CTT AAA ATC AAC GCT TTT AGC CGT GGG GAT AAG GAT TTG 768 
Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
825 830 835 

AGA GCC AAA ATT GAT GTG GGT GAT CGC AAC GAT GAA ATC TCG GAA GTG 816 
Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
840 845 850 

C CGT GGG ATC AAT TTG TTT GTG GAA AAC GCC CGC TTG ATT ATG GAA 864 
y Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
'55 860 865 870 

GAG ATT AAA GGG ATT TCC ACC CTC AAT AAA ACT TCA ATG GAT AAA TTA 912 
Glu He Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
875 880 885 

GTC CAA ATC ACG CAA GAA ACC CAA AAG AGC ATG AAA GAT TCC TCA ACC 960 
Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
890 895 900 

ACC CTA AAT TCC GTG AAA AAT AAA GCC ACT GAT ATA GCG AGC ATG ATG 1008 
Thr Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
905 910 915 

AAT GCT TCC ATA GAG CAA TCT CAA GGG TTA AGG AAG CGT TTG ATT GAA 1056 
Asn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 
920 925 930 

ACG CAA GGG CTG GTC AAA GAG AGC AAG GAT GCG ATC GGG GAT TTA TTT 1104 
Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 
5 940 945 950 

r T CAA ATC ACA GAG AGC GCG CAC ACT GAA GAG GAA CTC TCT AGC AAA 1152 
Ser Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 
955 960 965 

GTG GAG CAG CTA AGC CGT AAC GCT GAT GAT GTC AAA TCC ATT CTG GAT 1200 
Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 
970 975 980 

ATT ATC AAT GAT ATT GCC GAT CAA ACG AAT TTA TTA GCC CTA AAC GCT 124 8 

He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 
985 990 995 

GCT ATT GAA GCC GCA AGG GCT GGC GAG CAT GGC AGA GGC TTT GCG GTG 12 96 

Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 
1000 1005 1010 

GTG GCT GAT GAA GTT AGG AAT TTA GCC GGG CGC ACT CAA AAG TCT TTA 134 4 

Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
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1015 1020 1025 1030 

GCC GAA ATC AAT TCC ACT ATC ATG GTG ATT GTC CAA GAA ATC AAT GCC 13 92 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu lie Asn Ala 
1035 1040 1045 

GTG AGT TCG CAA ATG AAT CTC AAT TCG CAA AAA ATG GAG CGT TTG AGC 144 0 

Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
1050 1055 1060 

GAT ATG AGT AAA AGC GTG CAA GAA ACT TAC GAA AAA ATG AGT TCT AAT 14 88 

Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
1065 1070 1075 

TTA AGC TCA GTC GTG TCA GAC AGC AAT CAA AGC ATG GAC GAT TAC GCC 1536 

Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
1080 1085 1090 

1584 



1632 



AAA 


TCC 


GGA 


CAC 


CAA 


ATT GAA 


GTT 


ATG 


GTA 


AGC 


GAT 


TTT 


GCA 


GAG 


GTG 


iys 


Ser 


Gly 


His 


Gin 


He Glu 


Val 


Met 


Val 


Ser 


Asp 


Phe 


Ala 


Glu 


Val 


^095 








1100 








1105 








1110 


CAA 


AAA 


GTG 


GCT 


TCT 


AAG ACT 


TTA 


GCG 


GAT 


TCT 


TCA 


GAT 


ATT 


TTA 


AAC 


Glu 


Lys 


Val 


Ala 


Ser 


Lys Thr 


Leu 


Ala 


Asp 


Ser 


Ser 


Asp 


He 


Leu 


Asn 










1115 






1120 








1125 


ATC 


GCT 


ACG 


CAT 


GTG 


AGT GGA 


ACG 


ACC 


ATG 


AAT 


TTA 


GAC 


AAA 


CAA 


GTG 


He 


Ala 


Thr 


His 


Val 


Ser Gly 


Thr 


Thr 


Met 


Asn 


Leu 


Asp 


Lys 


Gin 


Val 








1130 




1135 








1140 




AAT 


TTG 


TTT 


AAA 


ACT 


TAA 




















Asn 


Leu 


Phe 


Lys 


Thr 


* 





















1680 



1698 



1145 




(2) ANGABEN ZU SEQ ID NO: 68: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 566 Aminosauren 

( B ) ART : Amino s aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 68: 

Met Met Phe Ser Ser Met Phe Ala Ser Leu Gly Thr Arg He Met Leu 
15 10 15 

Val Val Leu Ala Ala Leu Leu Gly Leu Gly Gly Leu Phe He Gly Phe 
20 25 30 

Val Lys Val Met Gin Lys Asp Val Leu Ala Gin Leu Met Glu His Leu 
35 40 45 

Glu Thr Gly Gin Tyr Lys Lys Arg Glu Lys Thr Leu Ala Tyr Met Thr 
50 55 60 

Lys He He Glu Gin Gly He His Glu Tyr Tyr Lys Asn Phe Asp Asn 
65 70 75 80 



Ala Thr Ala Arg Lys Met Ala Leu Asp Tyr Phe Lys Arg He Asn Asp 
85 90 95 
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Asp Lys Gly Met lie Tyr Met Val Val Val Asp Lys Asn Gly Val Val 
100 105 110 

Leu Phe Asp Pro Val Asn Pro Lys Thr Val Gly Gin Ser Gly Leu Asp 
115 120 125 

Ala Gin Ser Val Asp Gly Val Tyr Tyr Val Arg Gly Tyr Leu Glu Ala 
130 135 140 

Ala Lys Lys Gly Gly Gly Tyr Thr Tyr Tyr Lys Met Pro Lys Tyr Asp 
145 150 155 160 

Gly Gly Val Pro Glu Lys Lys Phe Ala Tyr Ser His Tyr Asp Glu Val 
165 170 175 

Ser Gin Met Val lie Ala Thr Thr Ser Tyr Tyr Thr Asp lie Asn Thr 
180 185 190 

Glu Asn Lys Ala lie Lys Glu Gly Val Asn Lys Val Phe Asp Glu Asn 
195 200 205 



r Thr Lys Leu Phe Leu Trp He Leu Thr Ala Thr He Ala Leu Val 
210 215 220 

Val Leu Thr Leu He Tyr Ala Lys Leu Arg He Val Lys Arg He Asp 
225 230 235 240 

Glu Leu Val Leu Lys He Asn Ala Phe Ser Arg Gly Asp Lys Asp Leu 
245 250 255 

Arg Ala Lys He Asp Val Gly Asp Arg Asn Asp Glu He Ser Gin Val 
260 265 270 

Gly Arg Gly He Asn Leu Phe Val Glu Asn Ala Arg Leu He Met Glu 
275 280 285 

Glu He Lys Gly He Ser Thr Leu Asn Lys Thr Ser Met Asp Lys Leu 
290 295 300 

Val Gin He Thr Gin Glu Thr Gin Lys Ser Met Lys Asp Ser Ser Thr 
305 310 315 320 



^Bfs: 



r Leu Asn Ser Val Lys Asn Lys Ala Thr Asp He Ala Ser Met Met 
325 330 335 



sn Ala Ser He Glu Gin Ser Gin Gly Leu Arg Lys Arg Leu He Glu 

340 345 350 

Thr Gin Gly Leu Val Lys Glu Ser Lys Asp Ala He Gly Asp Leu Phe 

355 360 365 

Ser Gin He Thr Glu Ser Ala His Thr Glu Glu Glu Leu Ser Ser Lys 

370 375 380 

Val Glu Gin Leu Ser Arg Asn Ala Asp Asp Val Lys Ser He Leu Asp 

385 390 395 400 

He He Asn Asp He Ala Asp Gin Thr Asn Leu Leu Ala Leu Asn Ala 

405 410 415 

Ala He Glu Ala Ala Arg Ala Gly Glu His Gly Arg Gly Phe Ala Val 

420 425 430 
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Val Ala Asp Glu Val Arg Asn Leu Ala Gly Arg Thr Gin Lys Ser Leu 
435 440 445 

Ala Glu lie Asn Ser Thr lie Met Val lie Val Gin Glu lie Asn Ala 
450 455 460 

Val Ser Ser Gin Met Asn Leu Asn Ser Gin Lys Met Glu Arg Leu Ser 
465 470 475 480 

Asp Met Ser Lys Ser Val Gin Glu Thr Tyr Glu Lys Met Ser Ser Asn 
485 490 495 

Leu Ser Ser Val Val Ser Asp Ser Asn Gin Ser Met Asp Asp Tyr Ala 
500 505 510 

Lys Ser Gly His Gin lie Glu Val Met Val Ser Asp Phe Ala Glu Val 
515 520 525 



4 



Glu Lys Val Ala Ser Lys Thr Leu Ala Asp Ser Ser Asp lie Leu Asn 
530 535 540 



e Ala Thr His Val Ser Gly Thr Thr Met Asn Leu Asp Lys Gin Val 
45 550 555 560 

Asn Leu Phe Lys Thr * 
565 

(2) ANGABEN ZU SEQ ID NO: 69: 

( i ) SEQUENZ KENNZ E I CHEN : 

(A) LANGE: 855 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE : linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
<B) CLON(E) : HPS036 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .855 



<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 69: 

TTG GGT ATC AAT ATG TGT TCT AAA AAA ATA AGA AAT CTC ATT TTA TGC 4 8 

Leu Gly lie Asn Met Cys Ser Lys Lys lie Arg Asn Leu lie Leu Cys 
570 575 580 

TTT GGT TTT ATG TTG GGC TTG CAC GCT GAA GAA AAT ACG ACT GAA GGA 96 
Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
585 590 595 

AAT ATG ACT GAA GAA AAT ATC TCT AAA GAC GCT CCC ATT CTT TTG GAA 144 
Asn Met Thr Glu Glu Asn lie Ser Lys Asp Ala Pro lie Leu Leu Glu 
600 605 610 

GAA AAA CGC GCC CAA ACG CTA GAA TTT AAA GAA GAA AAG GAA GCT AAA 192 
Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
615 620 625 630 
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AAG AAT ATT GAT GAA AAA AGC CTG CTT GAA GAA ATC CAT AAG AAA AAA 240 
Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
635 640 645 

CGC CAA CTT TAC ATG CTC AAA GGG GAA TTG CAT GAA AAA AAT GAA TCT 288 
Arg Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
650 655 660 

CTC TTG TTC CAA CGA ATG GCT AAA AAT AAG AGC GGT TTT TTT ATA GGC 336 
Leu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe lie Gly 
665 670 675 

GTA ATC CTT GGC GAT ATA GGG GTT AGC GCT CAT TCT TAT GAG AAG TTT 3 84 

Val lie Leu Gly Asp lie Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
680 685 690 

GAA CTT TTA AGC AAT ATT CAA GCT TCT CCT TTG TTG TAT GGC TTA AGG 43 2 

Glu Leu Leu Ser Asn lie Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
695 700 705 710 

C GGG TAT CAA AAG TAT TTT GCT AAC GGG ATT AGC GCC TTA CGC TTT 480 
r Gly Tyr Gin Lys Tyr Phe Ala Asn Gly lie Ser Ala Leu Arg Phe 
715 720 725 

TAT GGG GAG TAT TTA GGG GGG GCG ATG AAA GGA TTT AAA AGC GAT TCT 528 
Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
730 735 740 

TTA GCC TCT TAT CAA ACC GCA AGC TTG AAC ATT GAT TTG TTG ATG GAT 576 
Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn lie Asp Leu Leu Met Asp 
745 750 755 

AAG CCT ATT GAC AAA GAA AAA AGG TTT GCG TTA GGG ATA TTT GGA GGC 624 
Lys Pro lie Asp Lys Glu Lys Arg Phe Ala Leu Gly lie Phe Gly Gly 
760 765 770 

GTT GGA GTG GGG TGG AAT GGG ATG TAT CAA AAT TTA AAA GAG GTT AAA 672 
Val Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
775 780 785 790 

GGG TAT TCA CAG CCT AAC GCT TTT GGA TTA GTG CTA AAT TTA GGG GTG 72 0 

Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
795 800 805 

C ATG ACG CTT AAC CTC AAA CAC CGC TTT GAA TTA GCC TTA AAA ATG 768 
Ser Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
810 815 820 

CCT CCC TTA AAA GAA ACT TCG CAA ACC TTT TTA TAT TAT TTT AAA AGC 816 
Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
825 830 835 

ACT AAT ATT TAT TAT ATT AGT TAC AAC TAT TTA TTG TAA 855 
Thr Asn lie Tyr Tyr lie Ser Tyr Asn Tyr Leu Leu * 
840 845 850 



(2) ANGABEN ZU SEQ ID NO: 70: 



( i ) S EQU ENZ KENNZ EI CHEN: 

(A) LANGE: 285 Aminosauren 

(B) ART: Aminosaure 
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(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 70: 

Leu Gly lie Asn Met Cys Ser Lys Lvs lie Arg Asn Leu lie Leu Cys 
1 5 10 15 

Phe Gly Phe Met Leu Gly Leu His Ala Glu Glu Asn Thr Thr Glu Gly 
20 25 30 

Asn Met Thr Glu Glu Asn lie Ser Lys Asp Ala Pro lie Leu Leu Glu 
35 40 45 

Glu Lys Arg Ala Gin Thr Leu Glu Phe Lys Glu Glu Lys Glu Ala Lys 
50 55 60 

Lys Asn lie Asp Glu Lys Ser Leu Leu Glu Glu lie His Lys Lys Lys 
65 70 75 80 

g Gin Leu Tyr Met Leu Lys Gly Glu Leu His Glu Lys Asn Glu Ser 
85 90 95 

Leu Leu Phe Gin Arg Met Ala Lys Asn Lys Ser Gly Phe Phe lie Gly 
100 105 110 

Val lie Leu Gly Asp lie Gly Val Ser Ala His Ser Tyr Glu Lys Phe 
115 120 125 

Glu Leu Leu Ser Asn lie Gin Ala Ser Pro Leu Leu Tyr Gly Leu Arg 
130 135 140 

Ser Gly Tyr Gin Lys Tyr Phe Ala Asn Gly lie Ser Ala Leu Arg Phe 
145 150 155 160 

Tyr Gly Glu Tyr Leu Gly Gly Ala Met Lys Gly Phe Lys Ser Asp Ser 
165 170 175 

Leu Ala Ser Tyr Gin Thr Ala Ser Leu Asn lie Asp Leu Leu Met Asp 
180 185 190 



.ys Pro lie Asp Lys Glu Lys Arg Phe Ala Leu Gly lie Phe Gly Gly 
195 200 205 



al Gly Val Gly Trp Asn Gly Met Tyr Gin Asn Leu Lys Glu Val Lys 
210 215 220 

Gly Tyr Ser Gin Pro Asn Ala Phe Gly Leu Val Leu Asn Leu Gly Val 
225 230 235 240 

Ser Met Thr Leu Asn Leu Lys His Arg Phe Glu Leu Ala Leu Lys Met 
245 250 255 

Pro Pro Leu Lys Glu Thr Ser Gin Thr Phe Leu Tyr Tyr Phe Lys Ser 
260 265 270 

Thr Asn lie Tyr Tyr lie Ser Tyr Asn Tyr Leu Leu * 
275 280 285 

(2) ANGABEN ZU SEQ ID NO: 71: 

(i) S EQUENZ KENNZ E I CHEN : 



Ill 



(A) LANGE: 669 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 
<D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS038 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..669 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 71: 

ATG GCT GAA AAT TCT TTC AAA AAT GTT TCC ACA CAA CCC AAA GTA TTT 4 8 

Met Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro I*ys Val Phe 
290 295 300 



C TTA TTG CCA GCT AAA ACC CTG TTT CTT TTA GGA GGC GTT TTT AGC 96 
he Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
305 310 315 

GCG TTT TTT ATC CTT ATT GCT GGC TTG GTT TTT TTT GAT TAT GCT CAT 144 
Ala Phe Phe lie Leu lie Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
320 325 330 

TTG ATG GAC AAT GCC ATT TTT AAT TTT GCG CGT TCA ACC CCC TTT AAT 192 
Leu Met Asp Asn Ala lie Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
335 340 345 

TCC AGC CCT ATT TTA ACT CTA ATC CTC CAA AAT ATC GCT AAT TTA GGC 24 0 

Ser Ser Pro lie Leu Thr Leu lie Leu Gin Asn lie Ala Asn Leu Gly 
350 355 360 365 

TCT TCT CAA TTC GTG TTG CCT TTG AGT TTG TTG GTG GGG GTG TTT TTA 2 88 

Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
370 375 380 



GC CTT TAT CGC AGA AAC TTA GTG CTT GGG GTG TGG TTT GTG TTA AGC 33 6 

r Leu Tyr Arg Arg Asn -Leu Val Leu Gly Val Trp Phe Val Leu Ser 
385 390 395 



GTG ATC TTG TTT GAA GCC CTT TTA GAA TCT TTA AAA CAC CTT TTT GCA 3 84 

Val lie Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 

400 405 410 

TAT TCC ATT CAG TGG CTT TCG CGC AGC GCT AAT TTC CCT AAC GCT ACT 4 32 

Tyr Ser lie Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 

415 420 425 

GCG CTT TCT TTA GTG CTA TTT TAT GGG TTG CTT ATT TTA TTG ATA CCC 4 80 

Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu lie Leu Leu lie Pro 

430 435 440 445 

CAT TTA ATC ACG CAT CAA ACG CTT AAA AAT GTT CTT TTT TAT AGC TTA 52 8 

His Leu lie Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 

450 455 460 

TTT GGT TTG ATT TTT TTA ATA GGG TTA GCA CTG ATT GTT TTA GGG GTT 57 6 
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Phe Gly Leu lie Phe Leu lie Gly Leu Ala Leu He Val Leu Gly Val 

465 470 475 

TCT TTC AGT AGT GTT TTA GGA GGG TTT TGT TTA GGG GCG TTA GGG GCT 624 

Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 

480 485 490 

TGT TTT TCC ATA GGG ATT TAT TTG AGC GTG TTT CAA AAG ATC TAA 669 

Cys Phe Ser He Gly He Tyr Leu Ser Val Phe Gin Lys He * 

495 500 505 



(2) ANGABEN ZU SEQ ID NO: 72: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 223 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 



^^^^ 



(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 72: 



et Ala Glu Asn Ser Phe Lys Asn Val Ser Thr Gin Pro Lys Val Phe 
15 10 15 

Phe Leu Leu Pro Ala Lys Thr Leu Phe Leu Leu Gly Gly Val Phe Ser 
20 25 30 

Ala Phe Phe He Leu He Ala Gly Leu Val Phe Phe Asp Tyr Ala His 
35 40 45 

Leu Met Asp Asn Ala He Phe Asn Phe Ala Arg Ser Thr Pro Phe Asn 
50 55 60 

Ser Ser Pro He Leu Thr Leu He Leu Gin Asn He Ala Asn Leu Gly 
65 70 75 80 

Ser Ser Gin Phe Val Leu Pro Leu Ser Leu Leu Val Gly Val Phe Leu 
85 90 95 

Ser Leu Tyr Arg Arg Asn Leu Val Leu Gly Val Trp Phe Val Leu Ser 
100 105 110 

1 He Leu Phe Glu Ala Leu Leu Glu Ser Leu Lys His Leu Phe Ala 
115 120 125 

Tyr Ser He Gin Trp Leu Ser Arg Ser Ala Asn Phe Pro Asn Ala Thr 
130 135 140 

Ala Leu Ser Leu Val Leu Phe Tyr Gly Leu Leu He Leu Leu He Pro 
145 150 155 160 

His Leu He Thr His Gin Thr Leu Lys Asn Val Leu Phe Tyr Ser Leu 
165 170 175 

Phe Gly Leu He Phe Leu He Gly Leu Ala Leu He Val Leu Gly Val 
180 185 190 

Ser Phe Ser Ser Val Leu Gly Gly Phe Cys Leu Gly Ala Leu Gly Ala 
195 200 205 

Cys Phe Ser He Gly He Tyr Leu Ser Val Phe Gin Lys He * 



113 



210 215 220 

(2) ANGABEN ZU SEQ ID NO: 73: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 804 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



^^^^ 



(vii) UNM I TTE LB ARE HERKUNFT: 

(B) CLON(E) : HPS039 (HPS147) 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..804 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 73: 



TG TCA GAA AAA GAA AGA CTG AAT GAA GTG ATC TTA GAA GAA GAA AAT 48 
Met Ser Glu Lys Glu Arg Leu Asn Glu Val lie Leu Glu Glu Glu Asn 
225 230 235 

AAT GGG AGC GGC ACT AAA AAG GTG TTT TTG ATC GTG GCT ATA GCC ATT 96 
Asn Gly Ser Gly Thr Lys Lys Val Phe Leu lie Val Ala lie Ala lie 
240 245 250 255 

ATC ATT TTA GCG GTG CTT TTA ATG GTG TTT TGG AAA AGC ACG AGA GTC 144 
lie lie Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
260 265 270 

GCT CCT AAA GAG ACT TTT TTA CAA ACC GAT AGC GGC ATG CAA AAA ATA 192 
Ala Pro Lys Glu Thr Phe Leu Gin Thr Asp Ser Gly Met Gin Lys lie 
275 280 285 

GGC AAC ACT AAA GAC GAG AAA AAA GAC GAT GAG TTT GAA AGC TTG AAT 240 
Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
290 295 300 

G GAT CCT TCC AAG CAA GAA GAC AAG CTA GAC AAA GTG GCG GAT AAT 288 
u Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
305 310 315 

GTT AAG AAG CAA GAA AAT GAT GCG TTT AAC ATG CCC ACT CAA ACC GAT 336 
Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
320 325 330 335 

CAA ACT CAA ACG GAG ATG AAA ACA ACA GAA GAA ACG CAA GAA GCT CAA 3 84 

Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
340 345 350 

AAA GGA TTA AAA GTT GTT GAG CAC ACT AGC ACT CAA AAA GAA TCT CAA 432 
Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
355 360 365 

GCT GTG GCT AAA AAA GAA ATC TCC CAT AAA AAG CCT AAA GCA ACC CCT 4 80 

Ala Val Ala Lys Lys Glu lie Ser His Lys Lys Pro Lys Ala Thr Pro 
370 375 380 
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AAA GAT AAG GAA GCC CAT AAA GAT AAA GAT AAG CAT GCG GTT AAA GAG 52 8 

Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
385 390 395 

CTA AAA GTC AAA AAA GAA GCT CAT AAA GAA GTT CCT AAA AAA GCC AAT 576 
Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
400 405 410 415 

TCT AAA ACC ACT CTT ACT AAA GGG CAT TAT TTG CAA GTG GGG GTT TTT 624 
Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
420 425 430 

GCG CAC ACG CCC AAT AAA GCC TTT TTG CAA GCG TTT AAC CAA TTC CCC 672 
Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
435 440 445 

CAT AAG ATT GAA GAT AGG GGG TCT ACT AAA CGC TAT CTC ATA GGC CCT 720 
His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu lie Gly Pro 
450 455 460 

T AAG AAT AAG CAA GAA GCC TTA ATG CAT GCT GAT GAA GTC AGC AAA 768 
r Lys Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
465 470 475 

AAG ATG ACT AAA CCG GTT GTC ATA GAA GCG CGG TAG 804 
Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
480 485 490 



(2) ANGABEN ZU SEQ ID NO: 74: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 268 Aminos auren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 74: 

Met Ser Glu Lys Glu Arg Leu Asn Glu Val lie Leu Glu Glu Glu Asn 
15 10 15 



n Gly Ser Gly Thr Lys Lys Val Phe Leu lie Val Ala lie Ala lie 
20 25 30 



He He Leu Ala Val Leu Leu Met Val Phe Trp Lys Ser Thr Arg Val 
35 40 45 

Ala Pro Lys Glu Thr Phe Leu Gin Thr Asp Ser Gly Met Gin Lys He 
50 55 60 

Gly Asn Thr Lys Asp Glu Lys Lys Asp Asp Glu Phe Glu Ser Leu Asn 
65 70 75 80 

Leu Asp Pro Ser Lys Gin Glu Asp Lys Leu Asp Lys Val Ala Asp Asn 
85 90 95 

Val Lys Lys Gin Glu Asn Asp Ala Phe Asn Met Pro Thr Gin Thr Asp 
100 105 110 

Gin Thr Gin Thr Glu Met Lys Thr Thr Glu Glu Thr Gin Glu Ala Gin 
115 120 125 
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Lys Gly Leu Lys Val Val Glu His Thr Ser Thr Gin Lys Glu Ser Gin 
130 135 140 

Ala Val Ala Lys Lys Glu lie Ser His Lys Lys Pro Lys Ala Thr Pro 
145 150 155 160 

Lys Asp Lys Glu Ala His Lys Asp Lys Asp Lys His Ala Val Lys Glu 
165 170 175 

Leu Lys Val Lys Lys Glu Ala His Lys Glu Val Pro Lys Lys Ala Asn 
180 185 190 

Ser Lys Thr Thr Leu Thr Lys Gly His Tyr Leu Gin Val Gly Val Phe 
195 200 205 

Ala His Thr Pro Asn Lys Ala Phe Leu Gin Ala Phe Asn Gin Phe Pro 
210 215 220 



• 



His Lys lie Glu Asp Arg Gly Ser Thr Lys Arg Tyr Leu lie Gly Pro 
"25 230 235 240 



\/x Lys Asn Lys Gin Glu Ala Leu Met His Ala Asp Glu Val Ser Lys 
245 250 255 

Lys Met Thr Lys Pro Val Val lie Glu Ala Arg * 
260 265 

(2) ANGABEN ZU SEQ ID NO: ^75: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1545 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS040 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1545 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 75: 



GTG AGG CAA GAA AAG TAT TTT CTG ACT TCT TCT TTA TCG CTT TTA TCG 48 
Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
270 275 280 

TTT TTA TTA TGT CCT GCA GAA GCT TTT GAT TAT CGC TTT AGC GGT CGT 96 
Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
285 290 295 300 

GTG GAG AAC TTT TCT AAG ATT GGT TTT AAC AAT TCT CAA ATC AAT ACT 144 
Val Glu Asn Phe Ser Lys lie Gly Phe Asn Asn Ser Gin lie Asn Thr 
305 310 315 

AAA AAA GGG ATT TAT CCT ACT GAA AGT TTT ATA GAT ATT GTA ACT TTA 192 
Lys Lys Gly lie Tyr Pro Thr Glu Ser Phe He Asp He Val Thr Leu 
320 325 330 
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GCG CAA GTC AAA GTC AAT TTA CTC CCT AAA GGC ACC GAA AAC CAT AGG 240 
Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
335 340 345 

CTC TCT GTC TCT TTG GGT GGG GCG ATT GCA GCC ATT CCT TAT GAT AAG 2 88 

Leu Ser Val Ser Leu Gly Gly Ala lie Ala Ala lie Pro Tyr Asp Lys 
350 355 360 

ACT AAA TAT GAT ATT AAC CAA GCT AAC GGG AAG ATT TTT GGC TCA ATT 336 
Thr Lys Tyr Asp lie Asn Gin Ala Asn Gly Lys lie Phe Gly Ser lie 
365 370 375 380 

GTA GAG AAT TTC ATT GGG GGC TAT CAT GGA TAC TTT TTT AAT AAG TAT 3 84 

Val Glu Asn Phe lie Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
385 390 395 

CTT GGC CCT GCT TAT GCG GGG ACT TCT CAA TCA GCG AGC TAT CAT GCA 432 
Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
400 405 410 

GG CCT TAT GTG GTG GAT ACC GCT TTT TTA CGA TAC GAT TAC AAA GAT 4 80 

rg Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
415 420 425 

GTT TTT GQG TTT AAQ GAA GCG gat 

Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn lie Asp Phe Met 
430 435 440 

AGC GGA TCG AAT CAA GGG TGG GAA GTG TAT TAT CAG CCC TAT AAG ACT 576 
Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
445 450 455 460 

GAA ACG CAA AGG TTA AGG TTT TGG TGG TGG AGT TCT TTT GGG AGA GGT 624 
Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
465 470 475 

TTA GCG TTC AAC TCT TGG ATT TAT GAG TTT TTT GCG ACG GTG CCT TAT 672 
Leu Ala Phe Asn Ser Trp lie Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
480 485 490 



TTG AAA AAG GGA GGC AAT CCT AAT AAC AGC AAC GAT TTC ATC AAT TAT 720 
Leu Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe lie Asn Tyr 
495 500 505 



C TGG CAT GGA ATC ACC ACA ACC TAT TCT TAT AAA GGT TTA GAC GCT 768 
ly Trp His Gly lie Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
510 515 520 

CAA TTT TTT TAT TAT TTT GCG CCT AAG ACT TAT AAC GCT CCT GGC TTT 816 
Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 
525 530 535 540 

AAG CTG GTC TAT GAC ACG AAT AGG AAT TTT CAA AAT GTA GGC TTT CGC 864 
Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
545 550 555 

TCT CAA AGC ATG ATC ATG ACA ACC TTT CCT TTA TAC TAT AGA GGG TGG 912 
Ser Gin Ser Met lie Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
560 565 570 

TAT AAC CCA GAG ACA AAC ACT TAT AGT TTA GAA GAC AGC ACG CCT CAT 960 
Tyr Asn Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
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575 580 585 

GGC TCG TTG TTG GGG AGG AAT GGC GTT ACT TTA AAT ATC CGC CAG GTT 1008 
Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn lie Arg Gin Val 
590 595 600 

TTT TGG TGG GAT AAT TTC AAC TGG TCC ATT GGC TTT TAT AAC ACC TTT 1056 
Phe Trp Trp Asp Asn Phe Asn Trp Ser lie Gly Phe Tyr Asn Thr Phe 
605 610 615 620 

GGC AAT TCG GAC GCT TTT TTA GGC TCT CAC ACG ATG CCA AGG GGT AAT 1104 
Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
625 630 635 

AAC ACT TCC TAT ATC GGT AGT GAA ATC TCC ATA ACG ACT AGG CAT GCC 1152 
Asn Thr Ser Tyr lie Gly Ser Glu lie Ser He Thr Thr Arg His Ala 
640 645 650 

GGA ATG ATT GGC TAT GAT TTT TGG GAT AAT ACG GCT TAT GAT GGG CTA 1200 
ly Met He Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
655 660 665 

GCT GAT GCG ATC ACT AAC GCT AAC ACT TTC ACT TTT TAC ACT TCT GTT 1248 
Ala Asp Ala He Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
670 675 680 

GGA GGG ATC CAT AAG CGT TTT GCA TGG CAT GTT TTT GGG CGC GTC TCT 12 96 

Gly Gly He His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
68 5 690 695 700 

CAT GCG AAT AAA AAC GCG TTA GGG CAA GTG GGG AGG GCT AAT GAA TAT 1344 
His Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
705 710 715 

TCC TTG CAA TTC AAC GCG AGC TAT GCG TTC ACT GAA TCA ATC CTT CTT 13 92 

Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser He Leu Leu 
720 725 730 

AAC TTT AGG ATC ACT TAT TAT GGG GCT AGG ATC AAT AAA GGG TAT CAA 144 0 

Asn Phe Arg He Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
735 740 745 



£G GGG TAT TTT GGA GCG CCC AAA TTC AAT AAC CCT GAT GGC GAT TTT 14 88 

a Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
750 755 760 



AGC GCT AAT TAC CAA GAC AGA AGT TAC ATG ATG ACC AAC CTC ACG CTG 153 6 

Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 

765 770 775 780 

AAG TTT TGA 1545 

Lys Phe * 



(2) ANGABEN ZU SEQ ID NO: 76: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 515 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 76: 

Val Arg Gin Glu Lys Tyr Phe Leu Thr Ser Ser Leu Ser Leu Leu Ser 
15 10 15 

Phe Leu Leu Cys Pro Ala Glu Ala Phe Asp Tyr Arg Phe Ser Gly Arg 
20 25 30 

Val Glu Asn Phe Ser Lys lie Gly Phe Asn Asn Ser Gin lie Asn Thr 
35 40 45 

Lys Lys Gly lie Tyr Pro Thr Glu Ser Phe lie Asp lie Val Thr Leu 
50 55 60 

Ala Gin Val Lys Val Asn Leu Leu Pro Lys Gly Thr Glu Asn His Arg 
65 70 75 80 



Leu Ser Val Ser Leu Gly Gly Ala lie Ala Ala lie Pro Tyr Asp Lys 
85 90 95 



r Lys Tyr Asp lie Asn Gin Ala Asn Gly Lys lie Phe Gly Ser lie 
100 105 110 

Val Glu Asn Phe lie Gly Gly Tyr His Gly Tyr Phe Phe Asn Lys Tyr 
115 120 125 

Leu Gly Pro Ala Tyr Ala Gly Thr Ser Gin Ser Ala Ser Tyr His Ala 
130 135 140 

Arg Pro Tyr Val Val Asp Thr Ala Phe Leu Arg Tyr Asp Tyr Lys Asp 
145 150 155 160 

Val Phe Gly Phe Lys Ala Gly Arg Tyr Glu Ala Asn lie Asp Phe Met 
165 170 175 

Ser Gly Ser Asn Gin Gly Trp Glu Val Tyr Tyr Gin Pro Tyr Lys Thr 
180 185 190 

Glu Thr Gin Arg Leu Arg Phe Trp Trp Trp Ser Ser Phe Gly Arg Gly 
195 200 205 

iu Ala Phe Asn Ser Trp lie Tyr Glu Phe Phe Ala Thr Val Pro Tyr 
210 215 220 

ijeu Lys Lys Gly Gly Asn Pro Asn Asn Ser Asn Asp Phe lie Asn Tyr 
225 230 235 240 

Gly Trp His Gly lie Thr Thr Thr Tyr Ser Tyr Lys Gly Leu Asp Ala 
245 250 255 

Gin Phe Phe Tyr Tyr Phe Ala Pro Lys Thr Tyr Asn Ala Pro Gly Phe 
260 265 270 

Lys Leu Val Tyr Asp Thr Asn Arg Asn Phe Gin Asn Val Gly Phe Arg 
275 280 285 

Ser Gin Ser Met lie Met Thr Thr Phe Pro Leu Tyr Tyr Arg Gly Trp 
290 295 300 

Tyr Aon Pro Glu Thr Asn Thr Tyr Ser Leu Glu Asp Ser Thr Pro His 
305 310 315 320 
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Gly Ser Leu Leu Gly Arg Asn Gly Val Thr Leu Asn lie Arg Gin Val 
325 330 335 

Phe Trp Trp Asp Asn Phe Asn Trp Ser lie Gly Phe Tyr Asn Thr Phe 
340 345 350 

Gly Asn Ser Asp Ala Phe Leu Gly Ser His Thr Met Pro Arg Gly Asn 
355 360 365 

Asn Thr Ser Tyr lie Gly Ser Glu He Ser He Thr Thr Arg His Ala 
370 375 380 

Gly Met He Gly Tyr Asp Phe Trp Asp Asn Thr Ala Tyr Asp Gly Leu 
385 390 395 400 

Ala Asp Ala He Thr Asn Ala Asn Thr Phe Thr Phe Tyr Thr Ser Val 
405 410 415 

Gly Gly He His Lys Arg Phe Ala Trp His Val Phe Gly Arg Val Ser 
420 425 430 

is Ala Asn Lys Asn Ala Leu Gly Gin Val Gly Arg Ala Asn Glu Tyr 
435 440 445 

Ser Leu Gin Phe Asn Ala Ser Tyr Ala Phe Thr Glu Ser He Leu Leu 
450 455 460 

Asn Phe Arg He Thr Tyr Tyr Gly Ala Arg He Asn Lys Gly Tyr Gin 
465 470 475 480 

Ala Gly Tyr Phe Gly Ala Pro Lys Phe Asn Asn Pro Asp Gly Asp Phe 
485 490 495 

Ser Ala Asn Tyr Gin Asp Arg Ser Tyr Met Met Thr Asn Leu Thr Leu 
500 505 510 

Lys Phe * 
515 

(2) ANGABEN ZU SEQ ID NO: 77: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 912 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT : 
(B) CLON(E) : HPS048 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..912 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 77: 



ATG AAA AAG ATT ATT CTT GCA TGC CTT ATG GCT TTT GTG GGT GCC AAT 
Met Lys Lys He He Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
520 525 530 



48 
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TTA AGC GCA GAG CCT AAG TGG TAT AGC AAG GCC TAC AAC AAA ACA AAC 96 
Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
535 540 545 

ACC CAA AAA GGC TAT CTT TAT GGG AGT GGT TCA GCC ACT TCT AAA GAG 144 
Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
550 555 560 

GCT TCT AAA CAA AAA GCG TTA GCG GAT TTA GTG GCG TCT ATT AGC GTG 192 
Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser lie Ser Val 
565 570 575 

GTG GTT AAT TCC CAA ATC CAT ATT CAA AAA AGT CGT GTG GAC AAT AAG 24 0 

Val Val Asn Ser Gin lie His lie Gin Lys Ser Arg Val Asp Asn Lys 
580 585 590 595 

TTA AAA TCC AGC GAT TCG CAA ACG ATT AAC TTA AAG ACC GAT GAC TTG 2 88 

Leu Lys Ser Ser Asp Ser Gin Thr lie Asn Leu Lys Thr Asp Asp Leu 
600 605 610 



AA TTG AAT AAT GTA GAA ATT GTC AAT CAA GAA GTG CAA AAA GGG ATC 33 6 

lu Leu Asn Asn Val Glu lie Val Asn Gin Glu Val Gin Lys Gly lie 
615 620 625 




TAC TAC ACC AGA GTA AGG ATC AAT CAA AAC TTG TTT TTG CAG GGT TTA 384 
Tyr Tyr Thr Arg Val Arg lie Asn Gin Asn Leu Phe Leu Gin Gly Leu 
630 635 640 

AGG GAT AAG TAT AAC GCT CTT TAT GGG CAG TTT TCC ACC TTA ATG CCT 432 
Arg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
645 650 655 

AAG GTT TGT AAA GGG GTT TTT TTA CAG CAA TCC AAG AGC ATG GGG GAT 480 
Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
660 665 670 675 

TTA TTG GCT AAA GCG ATG CCT ATA GAA AGG ATT TTA AAA GCG TAT TCT 528 
Leu Leu Ala Lys Ala Met Pro lie Glu Arg lie Leu Lys Ala Tyr Ser 
680 685 690 

GTT CCG GTG GGT TCG TTA GAA AAT TAT GAA AAA ATC TAT TAT CAA AAC 576 
Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys lie Tyr Tyr Gin Asn 
695 700 705 

CT TTC AAA CCT AAA GTG CAA ATC ACT TTT GAT AAC AAC GGC GAT GCG 624 
Ala Phe Lys Pro Lys Val Gin lie Thr Phe Asp Asn Asn Gly Asp Ala 
710 715 720 

GAA ATC AAA AGC GCT CTC ATA AGC GCT TAT GCC AGA GTG CTA ACC CCT 672 
Glu lie Lys Ser Ala Leu lie Ser Ala Tyr Ala Arg Val Leu Thr Pro 
725 730 735 

AGT GAT GAA GAA AAA CTC TAT CAA ATC AAA AAT GAA GTT TTC ACA GAC 720 
Ser Asp Glu Glu Lys Leu Tyr Gin lie Lys Asn Glu Val Phe Thr Asp 
740 745 750 755 

AGT GCT AAT GGC ATC ACG CGC ATT AGA GTG GTT GTT AGC GCG AGC GAT 768 
Ser Ala Asn Gly He Thr Arg He Arg Val Val Val Ser Ala Ser Asp 
760 765 770 

TGT CAA GGC ACG CCT GTA TTG AAT AGA AGC CTT GAA GTG GAT GAA AAG 816 
Cys Gin Gly Thr Pro Val Leu Asn Arg Ser Leu Glu Val Asp Glu Lys 
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775 780 785 

AAT AAG AAT TTT GCT ATC ACG CGC TTA CAA TCT TTG CTT TAT AAA GAA 
Asn Lys Asn Phe Ala lie Thr Arg Leu Gin Ser Leu Leu Tyr Lys Glu 
790 795 800 

CTG AAA GAT TAT GCC AAT AAA GAA GGG CAA GGC AAT ACG GGG TTA TAA 
Leu Lys Asp Tyr Ala Asn Lys Glu Gly Gin Gly Asn Thr Gly Leu * 
805 810 815 

(2) ANGABEN ZU SEQ ID NO: 78: 

(i) SEQUENZKENNZE I CHEN : 

(A) LANGE: 304 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

<xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 78: 

et Lys Lys lie lie Leu Ala Cys Leu Met Ala Phe Val Gly Ala Asn 
15 10 15 

Leu Ser Ala Glu Pro Lys Trp Tyr Ser Lys Ala Tyr Asn Lys Thr Asn 
20 25 30 

Thr Gin Lys Gly Tyr Leu Tyr Gly Ser Gly Ser Ala Thr Ser Lys Glu 
35 40 45 

Ala Ser Lys Gin Lys Ala Leu Ala Asp Leu Val Ala Ser lie Ser Val 
50 55 60 

Val Val Asn Ser Gin lie His lie Gin Lys Ser Arg Val Asp Asn Lys 
65 70 75 80 

Leu Lys Ser Ser Asp Ser Gin Thr lie Asn Leu Lys Thr Asp Asp Leu 

85 90 95 

Glu Leu Asn Asn Val Glu lie Val Asn Gin Glu Val Gin Lys Gly lie 
100 105 110 



r 



r Tyr Thr Arg Val Arg lie Asn Gin Asn Leu Phe Leu Gin Gly Leu 
115 120 125 



Arg Asp Lys Tyr Asn Ala Leu Tyr Gly Gin Phe Ser Thr Leu Met Pro 
130 135 140 

Lys Val Cys Lys Gly Val Phe Leu Gin Gin Ser Lys Ser Met Gly Asp 
145 150 155 160 

Leu Leu Ala Lys Ala Met Pro lie Glu Arg lie Leu Lys Ala Tyr Ser 
165 170 175 

Val Pro Val Gly Ser Leu Glu Asn Tyr Glu Lys lie Tyr Tyr Gin Asn 
180 185 190 

Ala Phe Lys Pro Lys Val Gin lie Thr Phe Asp Asn Asn Gly Asp Ala 
195 200 205 

Glu lie Lys Ser Ala Leu lie Ser Ala Tyr Ala Arg Val Leu Thr Pro 
210 215 220 
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Ser Asp Glu Glu 
225 

Ser Ala Asn Gly 



Cys Gin Gly Thr 
260 

Asn Lys Asn Phe 
275 

Leu Lys Asp Tyr 
290 



Lys Leu Tyr Gin 
230 

lie Thr Arg lie 
245 

Pro Val Leu Asn 



Ala lie Thr Arg 
280 

Ala Asn Lys Glu 
295 



lie Lys Asn Glu 
235 

Arg Val Val Val 
250 

Arg Ser Leu Glu 
265 

Leu Gin Ser Leu 



Gly Gin Gly Asn 
300 



Val Phe Thr Asp 
240 

Ser Ala Ser Asp 
255 

Val Asp Glu Lys 
270 

Leu Tyr Lys Glu 
285 

Thr Gly Leu * 



(2) ANGABEN ZU SEQ ID NO: 79: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 834 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 




(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS050 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..834 

(xi) SEQTJENZBESCHREIBUNG: SEQ ID NO: 79: 

ATG AAA ACA AAC GGG CTT TTT AAA ATG TGG GGG CTG TTT TTA GTT TTA 4 8 

Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
305 310 315 320 

ATC GCT TTA GTC TTT AAT GCA TGT TCT GAT AGC CAT AAA GAA AAA AAG 96 
lie Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
325 330 335 

fAC GCT TTA GAA GTC ATT AAA CAA AGA GGG GTT TTA AAA GTG GGG GTT 144 
Asp Ala Leu Glu Val lie Lys Gin Arg Gly Val Leu Lys Val Gly Val 
340 345 350 

TTT AGC GAT AAG CCT CCT TTT GGC TCT GTG GAT TCT AAA GGG AAA TAT 192 
Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
355 360 365 

CAA GGC TAT GAT GTA GTT ATT GCT AAA CGC ATG GCT CTT GAT TTA TTG 240 
Gin Gly Tyr Asp Val Val lie Ala Lys Arg Met Ala Leu Asp Leu Leu 
370 375 380 

GGC GAT GAA AAT AAG ATT GAG TTT ATT CCT GTA GAA GCT TCA GCT AGG 2 88 

Gly Asp Glu Asn Lys He Glu Phe He Pro Val Glu Ala Ser Ala Arg 
385 390 395 400 

GTG GAA TTT TTA AAA' GCC AAT AAA GTG GAT ATT ATC ATG GCT AAT TTC 3 36 

Val Glu Phe Leu Lys Ala Asn Lys Val Asp He He Met Ala Asn Phe 
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405 410 415 

ACG CGC ACT AAA GAA AGA GAA AAA GTC GTG GAT TTC GCT AAG CCG TAT 384 
Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
420 425 430 

ATG AAA GTC GCT TTA GGG GTG GTT TCT AAA GAT GGG GTC ATT AAA AAT 432 
Met Lys Val Ala Leu Gly Val Val Ser Lys Asp Gly Val lie Lys Asn 
435 440 445 

ATA GAA GAG TTG AAA GAT AAA GAG TTG ATT GTG AAT AAA GGC. ACG ACA 480 
lie Glu Glu Leu Lys Asp Lys Glu Leu lie Val Asn Lys Gly Thr Thr 
450 455 460 

GCG GAT TTT TAT TTC ACT AAA AAT TAC CCC AAT ATC AAG CTT TTG AAA 52 8 

Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn lie Lys Leu Leu Lys 
465 470 475 480 

TTT GAG CAA AAT ACA GAG ACT TTT TTA GCC CTT TTA AAC AAT AAG GCT 576 
Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
485 490 495 

CC GCT CTA GCC CAT GAC AAC ACT TTA TTG CTC GCT TGG ACG AAA CAA 624 
Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
500 505 510 

CAC CCT GAA TTT AAA TTA GGC ATT ACA AGC CTT GGC GAT AAG GAT GTG 672 
His Pro Glu Phe Lys Leu Gly He Thr Ser Leu Gly Asp Lys Asp Val 
515 520 525 

ATC GCT CCA GCG ATT AAA AAA GGC AAC CCC AAG CTT TTA GAA TGG TTG 720 
He Ala Pro Ala He Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
530 535 540 

AAT AAC GAA ATA GAT TCC CTC ATT TCT AGC GAC TTC TTA AAA GAA GCT 768 
Asn Asn Glu lie Asp Ser Leu He Ser Ser Asp Phe Leu Lys Glu Ala 
545 550 555 560 

TAT CAA GAG ACT TTA GCA CCT GTT TAT GGC GAT GAA ATC AAA CCG GAA 816 
Tyr Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu He Lys Pro Glu 
565 570 575 



GAA ATT ATT TTT GAA TGA 834 
u He He Phe Glu * 
580 



(2) ANGABEN ZU SEQ ID NO: 80: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 278 Aminosauren 

( B ) ART : Aminosaur e 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 80: 

Met Lys Thr Asn Gly Leu Phe Lys Met Trp Gly Leu Phe Leu Val Leu 
1 5 10 15 

He Ala Leu Val Phe Asn Ala Cys Ser Asp Ser His Lys Glu Lys Lys 
20 25 30 
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Asp Ala Leu Glu Val lie Lys Gin Arg Gly Val Leu Lys Val Gly Val 
35 40 45 

Phe Ser Asp Lys Pro Pro Phe Gly Ser Val Asp Ser Lys Gly Lys Tyr 
50 55 60 

Gin Gly Tyr Asp Val Val lie Ala Lys Arg Met Ala Leu Asp Leu Leu 
65 70 75 80 

Gly Asp Glu Asn Lys lie Glu Phe lie Pro Val Glu Ala Ser Ala Arg 
85 90 95 

Val Glu Phe Leu Lys Ala Asn Lys Val Asp lie lie Met Ala Asn Phe 
100 105 110 

Thr Arg Thr Lys Glu Arg Glu Lys Val Val Asp Phe Ala Lys Pro Tyr 
115 120 125 

Met Lys Val Ala Leu Gly Val Val Ser Lys Asp Gly Val lie Lys Asn 
130 135 140 

le Glu Glu Leu Lys Asp Lys Glu Leu lie Val Asn Lys Gly Thr Thr 
145 150 155 160 

Ala Asp Phe Tyr Phe Thr Lys Asn Tyr Pro Asn lie Lys Leu Leu Lys 
165 170 175 

Phe Glu Gin Asn Thr Glu Thr Phe Leu Ala Leu Leu Asn Asn Lys Ala 
180 185 190 

Thr Ala Leu Ala His Asp Asn Thr Leu Leu Leu Ala Trp Thr Lys Gin 
195 200 205 

His Pro Glu Phe Lys Leu Gly lie Thr Ser Leu Gly Asp Lys Asp Val 
210 215 220 

lie Ala Pro Ala lie Lys Lys Gly Asn Pro Lys Leu Leu Glu Trp Leu 
225 230 235 240 

Asn Asn Glu lie Asp Ser Leu lie Ser Ser Asp Phe Leu Lys Glu Ala 
245 250 255 



r Gin Glu Thr Leu Ala Pro Val Tyr Gly Asp Glu lie Lys Pro Glu 
260 265 270 



Glu lie lie Phe Glu * 
275 

(2) ANGABEN ZU SEQ ID NO: 81: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 12 96 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS052 



(ix) MERKMAL: 



(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1296 




(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 81: 

GTG GCG TTA GCT GAA GAC GAT GGC TTT TAT ATG GGA GTG GGC TAT CAA 
Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
280 285 290 

ATC GGC GGC GCG CAA CAA AAT ATC GAT AAC AAA GGC AGC ACC CTA AGG 
lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
295 300 305 310 

AAT AAT GTC ATT AAT AAT TTC CGC CAA GTG GGC GTG GGT ATG GCA GGG 
Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
315 320 325 

GGT AAT GGG CTT TTA GCC TTA GCG ACA AAC ACG ACC ATG GAC GCT CTT 
ly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
330 335 340 

TTA GGG ATA GGC AAC CAA ATT GTC AAT ACT AAT ACA ACT GTT AGC AAC 
Leu Gly lie Gly Asn Gin lie Val Asn Thr Asn Thr Thr Val Ser Asn 
345 350 355 

AAC AAC GCA GAA TTA ACC CAG TTT AAA AAA ATA CTC CCT CAA ATT GAG 
Asn Asn Ala Glu Leu Thr Gin Phe Lys Lys lie Leu Pro Gin lie Glu 
360 365 370 

CAA CGC TTT GAA ACG AAT AAA AAC GCT TAT AGC GTT CAA GCC TTG CAA 
Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
375 380 385 390 

GTG TAT TTG AGT AAT GTG CTT TAT AAC TTG GTT AAT AAT AGT AAT AAT 
Val Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
395 400 405 

GGC AGT AAT AAT GGA GTC GTT CCT GAA TAT GTA GGA ATT ATA AAA GTT 
Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly lie lie Lys Val 
410 415 420 



£TC TAT GGT TCT CAA AAT GAA TTC AGT CTC TTA GCC ACG GAG AGT GTG 
u Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
425 430 435 



GTG CTT TTA AAC GCG CTT ACA AGG GTG AAT CTG GAT AGT AAT TCG GTG 
Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
440 445 450 

TTT TTA AAA GGG CTA TTA GCC CAA ATG CAG CTT TTT AAT GAC ACT TCT 
Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
455 460 465 470 

TCA GCA AAG CTA GGC CAG ATC GCA GAA AAC TTG AAG AAC GGT GGT GCA 
Ser Ala Lys Leu Gly Gin lie Ala Glu Asn Leu Lys Asn Gly Gly Ala 
475 480 485 

GGA TCA ATG CTC CAA AAG GAT GTG AAA ACC ATC TCG GAT CGA ATC GCT 
Gly Ser Met Leu Gin Lys Asp Val Lys Thr lie Ser Asp Arg lie Ala 
490 495 500 
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ACT TAC CAA GAG AAT CTA AAA CAG CTA GGA GGG ATG CTA AAG AAT TAG 72 0 

Thr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 

505 510 515 

GAT GAA CCC TAC TTG CCC CAA TTT GGG CCA GGC ACA AGC TCT CAG CAT 768 
Asp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
520 525 530 

GGG GTT ATT AAT GGC TTT GGC ATT CAA GTG GGC TAT AAG CAA TTT TTT 816 
Gly Val lie Asn Gly Phe Gly lie Gin Val Gly Tyr Lys Gin Phe Phe 
535 540 545 550 

GGG AAC AAG CGG AAT ATA GGC TTA CGA TAT TAC GCT TTC TTT GAT TAT 864 
Gly Asn Lys Arg Asn lie Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
555 560 565 

GGC TTT ACG CAA TTG GGC AGT CTT AGC AGC GCC GTT AAA GCG AAT ATC 912 
Gly Phe Thr Gin Leu Gly Ser Leu Ser Ser Ala Val Lys Ala Asn lie 
570 575 580 

TT ACT TAT GGC GCT GGC ACG GAC TTT TTA TGG AAT ATC TTT AGA AGG 960 
he Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn lie Phe Arg Arg 
585 590 595 

GTT TTT AGC GAT CAG TCC TTG AAT GTG GGG GTG TTT GGG GGC ATT CAA 100 8 

Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly lie Gin 
600 605 610 

ATA GCG GGT AAC ACT TGG GAT AGC TCT TTA AGA GGT CAA ATT GAA AAC 1056 
lie Ala Gly Asn Thr Trp Asp Ser Ser Leu Arg Gly Gin lie Glu Asn 
615 620 625 630 

TCG TTT AAA GAA TAC CCC ACT CCC ACG AAT TTC CAA TTT TTG TTT AAT 1104 
Ser Phe Lys Glu Tyr Pro Thr Pro Thr Asn Phe Gin Phe Leu Phe Asn 
635 640 645 

TTG GGT TTA AGG GCT CAT TTT GCC AGC ACC ATG CAC CGC CGG TTT TTG 1152 
Leu Gly Leu Arg Ala His Phe Ala Ser Thr Met His Arg Arg Phe Leu 
650 655 660 



AGC GCG TCT CAA AGC ATT CAG CAT GGG ATG GAA TTT GGC GTG AAA ATC 12 00 

Ser Ala Ser Gin Ser lie Gin His Gly Met Glu Phe Gly Val Lys lie 
665 670 675 



G GCT ATC AAT CAA AGG TAT TTG AGG GCC AAT GGG GCT GAT GTG GAT 124 8 

"Pro Ala lie Asn Gin Arg Tyr Leu Arg Ala Asn Gly Ala Asp Val Asp 
680 685 690 

TAC AGG CGT TTG TAT GCG TTC TAT ATC AAT TAC ACG ATA GGT TTT TAA 12 96 

Tyr Arg Arg Leu Tyr Ala Phe Tyr lie Asn Tyr Thr lie Gly Phe * 
695 700 705 710 

(2) ANGABEN ZU SEQ ID NO: 82; 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 432 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 82: 
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Val Ala Leu Ala Glu Asp Asp Gly Phe Tyr Met Gly Val Gly Tyr Gin 
1 5 10 15 

lie Gly Gly Ala Gin Gin Asn lie Asp Asn Lys Gly Ser Thr Leu Arg 
20 25 30 

Asn Asn Val lie Asn Asn Phe Arg Gin Val Gly Val Gly Met Ala Gly 
35 40 45 

Gly Asn Gly Leu Leu Ala Leu Ala Thr Asn Thr Thr Met Asp Ala Leu 
50 55 60 

Leu Gly lie Gly Asn Gin lie Val Asn Thr Asn Thr Thr Val Ser Asn 
65 70 75 80 

Asn ;.sn Ala Glu Leu Thr Gin Phe Lys Lys lie Leu Pro Gin lie Glu 

85 90 95 

Gin Arg Phe Glu Thr Asn Lys Asn Ala Tyr Ser Val Gin Ala Leu Gin 
100 105 110 

al Tyr Leu Ser Asn Val Leu Tyr Asn Leu Val Asn Asn Ser Asn Asn 
115 120 125 

Gly Ser Asn Asn Gly Val Val Pro Glu Tyr Val Gly lie He Lys Val 
130 135 140 

Leu Tyr Gly Ser Gin Asn Glu Phe Ser Leu Leu Ala Thr Glu Ser Val 
14 5 150 155 160 

Val Leu Leu Asn Ala Leu Thr Arg Val Asn Leu Asp Ser Asn Ser Val 
165 170 175 

Phe Leu Lys Gly Leu Leu Ala Gin Met Gin Leu Phe Asn Asp Thr Ser 
180 185 190 

Ser Ala Lys Leu Gly Gin He Ala Glu Asn Leu Lys Asn Gly Gly Ala 
195 200 205 



Gly Ser Met Leu Gin Lys Asp Val Lys Thr He Ser Asp Arg He Ala 
210 215 220 



'hr Tyr Gin Glu Asn Leu Lys Gin Leu Gly Gly Met Leu Lys Asn Tyr 
" 5 230 235 240 



sp Glu Pro Tyr Leu Pro Gin Phe Gly Pro Gly Thr Ser Ser Gin His 
245 250 255 

Gly Val He Asn Gly Phe Gly He Gin Val Gly Tyr Lys Gin Phe Phe 
260 265 270 

Gly Asn Lys Arg Asn He Gly Leu Arg Tyr Tyr Ala Phe Phe Asp Tyr 
275 280 285 

Gly Phe Thr Gin Leu Gly Ser Leu Ser Sen. Ala Val Lys Ala Asn He 
290 295 300 

Phe Thr Tyr Gly Ala Gly Thr Asp Phe Leu Trp Asn He Phe Arg Arg 
305 310 315 320 

Val Phe Ser Asp Gin Ser Leu Asn Val Gly Val Phe Gly Gly He Gin 
325 330 335 



He Ala Gly Asn 
340 

Ser Phe Lys Glu 
355 

Leu Gly Leu Arg 
370 

Ser Ala Ser Gin 
385 

Pro Ala He Asn 



Tyr Arg Arg Leu 
420 



Thr Trp Asp Ser 



Tyr Pro Thr Pro 
360 

Ala His Phe Ala 
375 

Ser He Gin His 
390 

Gin Arg Tyr Leu 
405 

Tyr Ala Phe Tyr 
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Ser Leu Arg Gly 
345 



Thr Asn Phe Gin 



Ser Thr Met His 
380 

Gly Met Glu Phe 
395 

Arg Ala Asn Gly 
410 

He Asn Tyr Thr 
425 



Gin He Glu Asn 
350 

Phe Leu Phe Asn 
365 



Arg Arg Phe Leu 



Gly Val Lys He 
400 

Ala Asp Val Asp 
415 

He Gly Phe * 
430 




ANGABEN ZU SEQ ID NO: 83: 

( i ) S E QUENZ KENNZ E I CHEN : 

(A) LANGE: 1197 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS056 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..H97 



(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 83: 

ATG GAA TCA GTA AAA ACA GGA AAA ACA AAT AAG GTT GGC AAG AAT ACA 
Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
435 440 445 

G ATG GCT AAT ACA AAG GCA AAT AAA GAG ACT CAT TTT AAA CAA GTG 
u Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
450 455 460 

AGC GCC ATT ACA AAT ATA ATC AGA TCA GTT GGT GGG TTT TTT ACA AAA 
Ser Ala He Thr Asn He He Arg Ser Val Gly Gly Phe Phe Thr Lys 
465 470 475 480 

ATT GCA AAG AGA GTT AGA GGA CTT GTA AAA AAA CAC CCC AAG AAA AGC 
He Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
485 490 495 

AGT GCG GCA TTA GTA GTA TTG ACC CAT ATT GCG TGC AAG AAA GCG AAA 
Ser Ala Ala Leu Val Val Leu Thr His He Ala Cys Lys Lys Ala Lys 
500 505 510 

GAA TTA GAC GAT AAA GTC CAA GAT AAA TCC AAA CAA GCT GAA AAA GAA 
Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
515 . 520 525 
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AAT CAA ATC AAT TGG TGG AAA TAT TCA GGA TTA ACA ATA GCG GCA AGT 
Asn Gin lie Asn Trp Trp Lys Tyr Ser Gly Leu Thr lie Ala Ala Ser 
530 535 540 

TTA TTA TTA GCC GCT TGT AGC GCT GGT GAT ACT GAT AAA CAG ATA GAA 
Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin lie Glu 
545 550 555 560 

CTA GAA CAA GAA AAA AAG GAA GCT GAA AAC GCT AGG GAT AGA GCG AAC 
Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
565 570 575 

AAG AGT GGG ATA GAA CTA GAA CAA GAA AGA CAG AAA ACA AAC AAG AGT 
Lys Ser Gly lie Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
580 585 590 

GGG ATA GAA CTC GCT AAT AGT CAA ATA AAA GCA GAA CAA GAA AGA CAA 
Gly lie Glu Leu Ala Asn Ser Gin lie Lys Ala Glu Gin Glu Arg Gin 
_ 595 600 605 

.G ACA GAA CAA GAA AAA CAA AAA GCA AAT AAG AGT GCG ATA GAG TTA 
s Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala lie Glu Leu 
610 615 620 



^^^^ 




GAA CAG CAA AAA CAA AAG ACC ATT AAT ACA CAA AGA GAT TTG ATT AAA 
Glu Gin Gin Lys Gin Lys Thr lie Asn Thr Gin Arg Asp Leu lie Lys 
625 630 635 640 

GAA CAG AAA GAT TTC ATT AAA GAA ACA GAA CAA AAT TGC CAA GAA AAT 
Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
645 650 655 

CAT AAT CAA TTC TTT ATT AAA AAA TTA GGA ATT AAG GGT GGC ATT GCT 
His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly lie Ala 
660 665 670 

ATA GAA GTA GAA GCT GAA TGC AAA ACC CCT AAA CCT GCA AAA ACC AAT 
lie Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
675 680 685 

CAA ACC CCT ATC CAG CCA AAA CAC CTC CCA AAC TCT AAA CAA CCT CAT 
Gin Thr Pro He Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
690 695 700 

T CAA AGA GGA TCA AAA GCG CAA GAG TTT ATC GCT TAT TTG CAA AAA 
"Ser Gin Arg Gly Ser Lys Ala Gin Glu Phe He Ala Tyr Leu Gin Lys 
7 05 710 715 720 

GAG CTA GAA TTT CTG CCC TAT TCG CAA AAA GCT ATC GCT AAA CAA GTG 
Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala He Ala Lys Gin Val 
725 730 735 

AAT TTC TAT AAA CCA AGT TCT ATC GCT TAT TTA GAA CTA GAT CCT AGA 
Asn Phe Tyr Lys Pro Ser Ser He Ala Tyr Leu Glu Leu Asp Pro Arg 
740 745 750 

GAT TTT AAG GTT ACA GAA GAA TGG CAA AAA GAA AAT CTA AAA ATA CGC 
Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys He Arg 
755 760 765 

TCT AAA GCT CAA GCT AAA ATG CTT GAA ATG AGG GAT TTA AAA CCA GAC 
Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 



770 



775 



780 



CCA CAA GCC CAC CTT CCA ACC TCT CAA AGC CTT TTG TTC GTT CAA AAA 
Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
785 790 795 800 

ATA TTT GCT GAT GTT AAT AAA GAA ATA GAA GCA GTT GCT AAT ACT GAA 
He Phe Ala Asp Val Asn Lys Glu He Glu Ala Val Ala Asn Thr Glu 
805 810 815 

AAG AAA GCA GAA AAA GCG GGT TAT GGT TAT AGT AAA AGG ATG TAG 
Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
820 825 830 




(2) ANGABEN ZU SEQ ID NO: 84: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 399 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 84: 

Met Glu Ser Val Lys Thr Gly Lys Thr Asn Lys Val Gly Lys Asn Thr 
1 5 10 15 

Glu Met Ala Asn Thr Lys Ala Asn Lys Glu Thr His Phe Lys Gin Val 
20 25 30 

Ser Ala He Thr Asn He He Arg Ser Val Gly Gly Phe Phe Thr Lys 
35 40 45 

He Ala Lys Arg Val Arg Gly Leu Val Lys Lys His Pro Lys Lys Ser 
50 55 60 

Ser Ala Ala Leu Val Val Leu Thr His He Ala Cys Lys Lys Ala Lys 
65 70 75 80 

Glu Leu Asp Asp Lys Val Gin Asp Lys Ser Lys Gin Ala Glu Lys Glu 
85 90 95 

sn Gin He Asn Trp Trp Lys Tyr Ser Gly Leu Thr He Ala Ala Ser 
100 105 110 

Leu Leu Leu Ala Ala Cys Ser Ala Gly Asp Thr Asp Lys Gin He Glu 
H5 120 125 

Leu Glu Gin Glu Lys Lys Glu Ala Glu Asn Ala Arg Asp Arg Ala Asn 
130 135 140 

Lys Ser Gly He Glu Leu Glu Gin Glu Arg Gin Lys Thr Asn Lys Ser 
145 150 155 160 

Gly He Glu Leu Ala Asn Ser Gin He Lys Ala Glu Gin Glu Arg Gin 
165 170 175 

Lys Thr Glu Gin Glu Lys Gin Lys Ala Asn Lys Ser Ala He Glu Leu 
180 185 190 

Glu Gin Gin Lys Gin Lys Thr He Asn Thr Gin Arg Asp Leu He Lys 
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195 200 205 

Glu Gin Lys Asp Phe lie Lys Glu Thr Glu Gin Asn Cys Gin Glu Asn 
210 215 220 

His Asn Gin Phe Phe lie Lys Lys Leu Gly lie Lys Gly Gly lie Ala 
225 230 235 240 

lie Glu Val Glu Ala Glu Cys Lys Thr Pro Lys Pro Ala Lys Thr Asn 
245 250 255 

Gin Thr Pro lie Gin Pro Lys His Leu Pro Asn Ser Lys Gin Pro His 
260 265 270 

Ser Gin Arg Gly Ser Lys Ala Gin Glu Phe lie Ala Tyr Leu Gin Lys 
2 75 280 285 

Glu Leu Glu Phe Leu Pro Tyr Ser Gin Lys Ala lie Ala Lys Gin Val 
290 295 300 

sn phe Lys Pro Ser Ser lie Ala Tyr Leu Glu Leu Asp Pro Arg 

05 310 315 320 

Asp Phe Lys Val Thr Glu Glu Trp Gin Lys Glu Asn Leu Lys lie Arg 
325 330 335 

Ser Lys Ala Gin Ala Lys Met Leu Glu Met Arg Asp Leu Lys Pro Asp 
340 345 350 

Pro Gin Ala His Leu Pro Thr Ser Gin Ser Leu Leu Phe Val Gin Lys 
355 360 365 

lie Phe Ala Asp Val Asn Lys Glu lie Glu Ala Val Ala Asn Thr Glu 
370 375 380 

Lys Lys Ala Glu Lys Ala Gly Tyr Gly Tyr Ser Lys Arg Met * 
385 390 395 

(2) ANGABEN ZU SEQ ID NO: 85: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1131 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS059 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1131 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 85: 

ATG AAT TTT TTT AAA ATC CTT TTA ATG GAA TTA AGA GCC ATT GTT TCT 
Met Asn Phe Phe Lys He Leu Leu Met Glu Leu Arg Ala He Val Ser 
400 405 410 415 
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CAT AAA GGC GTT TTA TTA ATC CTT ATA GGC GCT CCT TTA ATC TAT GGC 96 
His Lys Gly Val Leu Leu lie Leu lie Gly Ala Pro Leu lie Tyr Gly 
420 425 430 

TTA TTA TAC CCT TTG CCT TAT TTA AGA GAC ATC GTA ACG CAG CAA AAA 144 
Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp lie Val Thr Gin Gin Lys 
435 440 445 

ATC GCC CTT GTA GAT GAA GAC AAT TCC TTC CTT TCT AGG CAA TTA GCC 192 
lie Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
450 455 460 

TTC ATG GCG CAA AGC TCC AAC GAG TTA GAA ATC GCT TTT TTT AGC CCC 24 0 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu lie Ala Phe Phe Ser Pro 
465 470 475 

TCT ATG CTG GAA GCC AAA AAG CTT TTA AAA GAA GAA AAA ATT TAT GGG 288 
Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys lie Tyr Gly 
480 485 490 495 

TC TTG CAC ATT CCC TCT CAT TTT GAA GCC AAT ATC CAT AAA CAA GTG 336 
le Leu His lie Pro Ser His Phe Glu Ala Asn lie His Lys Gin Val 
500 505 510 

CCT GTA ACG ATA GAT TTT TAT GCG AAT TCC AAT TAC TTT TTG ATT TAT 3 84 

Pro Val Thr lie Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu lie Tyr 
515 520 525 

GGT GCG TTA GCG AAT GCG GTG GTG GAG AGC ATC AAC GCT TTA AAT GAT 432 
Gly Ala Leu Ala Asn Ala Val Val Glu Ser lie Asn Ala Leu Asn Asp 
530 535 540 

GAG ATA AGG TTC AAA CGC AAT GCC CAA ATA GAA GAA GCT GAA TTA GGG 480 
Glu He Arg Phe Lys Arg Asn Ala Gin He Glu Glu Ala Glu Leu Gly 
545 550 555 

ACA GAC GGG ATT AAA ATC AGG CCT ATC GCT TTA TAT AAC CCT AGT GAG 528 
Thr Asp Gly He Lys He Arg Pro He Ala Leu Tyr Asn Pro Ser Glu 
560 565 570 575 



GGG TAT TTG AAT TAC GCG CTC TCT AGC GTG TTT ATT TTC ATT TTG CAC 576 
Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe He Phe He Leu His 
580 585 590 



G GTG ATG CTC ATT GCA AGC AGC ATG TTT ACT AGC TCC AGG CGT TTG 624 
In Val Met Leu He Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 
595 600 605 

GAA . TTA GCC CTT TTA GAC AGA AAG CAA ATC GCT TTA AGG CTG TGC ACA 672 
Glu Leu Ala Leu Leu Asp Arg Lys Gin He Ala Leu Arg Leu Cys Thr 
610 615 620 

AGA CTT TTG GTG TTC ATG GGG GCG TTT AGC GTT TTT ATT TTA TGG TAT 72 0 

Arg Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
625 630 635 

TTT GGG GCG CTG TTT TCT TTT TAT GGG ATC GAA CGG CAT GGG AGC GCT 768 
Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
64 ° 645 650 655 

TTA ATG GTG TTT TTG AAT AGT TTG ATT TTC ATG CTT GCA ACC TTG AGT 816 
Leu Met Val Phe Leu Aon Ser Leu He Phe Met Leu Ala Thr Leu Ser 
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660 665 670 

TTG GGG TCG TTT TTA GGC GCA TGG ATT AAA AAT GAA GCC CAC ACC ACT 864 
Leu Gly Ser Phe Leu Gly Ala Trp lie Lys Asn Glu Ala His Thr Thr 
675 680 685 

CAA ATC GTT TTA ATT TCT TCT TTG CCC TTG ATT TTT ATG ATG GGT TTT 912 
Gin lie Val Leu lie Ser Ser Leu Pro Leu He Phe Met Met Gly Phe 
690 695 700 

GTG TGG CCT TTT GAA TCC TTG CCC TCT TAT TTA CAG GTT TTT GTT CAA 960 
Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
705 710 715 

ATA GTG CCA GCT TAT CAT GGG ATC AGT TTG CTA GGG CGA TTG AAT CAA 1008 
He Val Pro Ala Tyr His Gly He Ser Leu Leu Gly Arg Leu Asn Gin 
72 0 725 730 735 

ATG CAT GCG GAA TTT ATA GAT GTT TCC TTC CAT TTT TAT GCG CTT ATT 1056 
"et His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
740 745 750 

GCG ATT TTT ATT GCG AGT TTT ATA GGG AGT GTC TTT AAA CTC AGC TCT 1104 
Ala He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
755 760 765 

TTA AAG AAA GCT TGT GAA AAC GCT TAA 1131 
Leu Lys Lys Ala Cys Glu Asn Ala * 
770 775 



(2) ANGABEN ZU SEQ ID NO: 86: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE : 377 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 86: 

Met Asn Phe Phe Lys He Leu Leu Met Glu Leu Arg Ala He Val Ser 
1 5 10 15 

is Lys Gly Val Leu Leu He Leu He Gly Ala Pro Leu He Tyr Gly 
20 25 30 

Leu Leu Tyr Pro Leu Pro Tyr Leu Arg Asp He Val Thr Gin Gin Lys 
35 40 45 

He Ala Leu Val Asp Glu Asp Asn Ser Phe Leu Ser Arg Gin Leu Ala 
50 55 so 

Phe Met Ala Gin Ser Ser Asn Glu Leu Glu He Ala Phe Phe Ser Pro 
65 70 75 80 

Ser Met Leu Glu Ala Lys Lys Leu Leu Lys Glu Glu Lys He Tyr Gly 

85 90 95 

He Leu His He Pro Ser His Phe Glu Ala Asn He His Lys Gin Val 
100 105 110 
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Pro Val Thr lie Asp Phe Tyr Ala Asn Ser Asn Tyr Phe Leu lie Tyr 
115 120 125 

Gly Ala Leu Ala Asn Ala Val Val Glu Ser lie Asn Ala Leu Asn Asp 
130 135 140 

Glu lie Arg Phe Lys Arg Asn Ala Gin lie Glu Glu Ala Glu Leu Gly 
14 5 150 155 160 

Thr Asp Gly lie Lys lie Arg Pro lie Ala Leu Tyr Asn Pro Ser Glu 
165 170 175 

Gly Tyr Leu Asn Tyr Ala Leu Ser Ser Val Phe lie Phe lie Leu His 
180 185 190 

Gin Val Met Leu lie Ala Ser Ser Met Phe Thr Ser Ser Arg Arg Leu 
195 200 205 

Glu Leu Ala Leu Leu Asp Arg Lys Gin lie Ala Leu Arg Leu Cys Thr 
210 215 220 

g Leu Leu Val Phe Met Gly Ala Phe Ser Val Phe He Leu Trp Tyr 
225 230 235 240 

Phe Gly Ala Leu Phe Ser Phe Tyr Gly He Glu Arg His Gly Ser Ala 
245 250 255 

Leu Met Val Phe Leu Asn Ser Leu He Phe Met Leu Ala Thr Leu Ser 
260 265 270 

Leu Gly Ser Phe Leu Gly Ala Trp lie Lys Asn Glu Ala His Thr Thr 
275 280 285 

Gin He Val Leu He Ser Ser Leu Pro Leu He Phe Met Met Gly Phe 
290 295 300 

Val Trp Pro Phe Glu Ser Leu Pro Ser Tyr Leu Gin Val Phe Val Gin 
305 310 315 320 

He Val Pro Ala Tyr His Gly He Ser Leu Leu Gly Arg Leu Asn Gin 
325 330 335 

let His Ala Glu Phe He Asp Val Ser Phe His Phe Tyr Ala Leu He 
1 340 345 350 

J.a He Phe He Ala Ser Phe He Gly Ser Val Phe Lys Leu Ser Ser 
355 360 365 

Leu Lys Lys Ala Cys Glu Asn Ala * 
370 375 

(2) ANGABEN ZU SEQ ID NO: 87: 

( i ) S EQUENZKENNZE I CHEN : 

(A) LANGE: 516 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT : 
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(B) CLON(E) : HPS063 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..516 



V^HtAA 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 87: 

ATG TTT GTA GTT AAA ATG GTG TTA GGG TTT TTG ATC CTT TTA AGC CCT 4 8 

Met Phe Val Val Lys Met Val Leu Gly Phe Leu lie Leu Leu Ser Pro 
380 385 390 

TTG TGC GCT ACT GGA TTG GAT ATT TCA CAA ACA GAT ATT ATA GAG CGT 96 
Leu Cys Ala Thr Gly Leu Asp lie Ser Gin Thr Asp He He Glu Arg 
395 400 405 

TCT TTA AAT TTC CTT TTA TTT GTG GGG ATT TTG TGG TAT TTT TCG GCT 144 
Ser Leu Asn Phe Leu Leu Phe Val Gly He Leu Trp Tyr Phe Ser Ala 

415 420 425 



AAA CTG CGT TCA TTT TTA CGC TCC AAA AGT CTT GAA ATC TCC AAA 192 
Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu He Ser Lys 
430 435 440 

CGC TTA GAA GAG ATT CAA GCC CAA CTC AAA GTG AGT AAA GAA AAT AAG 24 0 

Arg Leu Glu Glu He Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
445 450 455 

AAA AAA CTC TTA AAA GAA TTA GAG CAA GCC AAA GAA AAA GCG GAA TTG 288 
Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
460 465 470 

ATT GTT TCT GAT GCG AAT AAA GAA GCT TAC ATG ATC ACG CAA AAA TAC 336 
He Val Ser Asp Ala Asn Lys Glu Ala Tyr Met He Thr Gin Lys Tyr 
475 480 485 

GAA TTG CAA ACC AAA ATG GAT GTG GAA AAT TTG ATC AAA AAT TCT AAG 384 
Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu He Lys Asn Ser Lys 
490 495 500 505 



^^^^ 



GCG TTG ATG GAT TTA GAA GTT AAA AAG ATC AAA AGA GAG CTG GTT GAA 432 
" " a Leu Met Asp Leu Glu Val Lys Lys He Lys Arg Glu Leu Val Glu 
510 515 520 



.GC GTT TTT AAA GAT CTA AGA GAG AGC AAA AAA GTC TCT TTC AAT GCG 480 
Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
525 530 535 

CAA GAT TGC GTG AAT ATT TTG AAA CAA AGG CTT TAA 516 
Gin Asp Cys Val Asn He Leu Lys Gin Arg Leu * 
540 545 



(2) ANGABEN ZU SEQ ID NO: 88: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 172 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 



<ii) ART DES MOLEKULS : Protein 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 88: 

Met Phe Val Val Lys Met Val Leu Gly Phe Leu lie Leu Leu Ser Pro 
15 10 15 

Leu Cys Ala Thr Gly Leu Asp lie Ser Gin Thr Asp lie lie Glu Arg 
20 25 30 

Ser Leu Asn Phe Leu Leu Phe Val Gly lie Leu Trp Tyr Phe Ser Ala 
35 40 45 

Lys Lys Leu Arg Ser Phe Leu Arg Ser Lys Ser Leu Glu lie Ser Lys 
50 55 60 

Arg Leu Glu Glu lie Gin Ala Gin Leu Lys Val Ser Lys Glu Asn Lys 
65 70 75 80 

Lys Lys Leu Leu Lys Glu Leu Glu Gin Ala Lys Glu Lys Ala Glu Leu 
85 90 95 

le Val Ser Asp Ala Asn Lys Glu Ala Tyr Met lie Thr Gin Lys Tyr 
100 105 110 

Glu Leu Gin Thr Lys Met Asp Val Glu Asn Leu lie Lys Asn Ser Lys 
115 120 125 

Ala Leu Met Asp Leu Glu Val Lys Lys lie Lys Arg Glu Leu Val Glu 
130 135 140 

Ser Val Phe Lys Asp Leu Arg Glu Ser Lys Lys Val Ser Phe Asn Ala 
145 150 155 160 

Gin Asp Cys Val Asn lie Leu Lys Gin Arg Leu * 
165 170 

(2) ANGABEN ZU SEQ ID NO: 89: 

(i) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 990 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS069 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .990 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 89: 

ATG TCA AAT AGC ATG TTG GAT AAA AAT AAA GCG ATT CTT ACA GGG GGT 4 8 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala lie Leu Thr Gly Gly 
175 180 185 



GGG GCT TTA TTG TTA GGG CTA ATC GTG CTT TTT TAT TTG GCT TAT CGC 
Gly Ala Leu Leu Leu Gly Leu lie Val Leu Phe Tyr Leu Ala Tyr Arg 
190 195 200 



96 
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CCT AAG GCT GAA GTG TTG CAA GGA TTT TTG GAA GCC AGA GAA TAC AGC 144 
Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
205 210 215 220 

GTG AGT TCC AAA GTC CCT GGC CGC ATT GAA AAG GTG TTT GTT AAA AAA 192 
Val Ser Ser Lys Val Pro Gly Arg lie Glu Lys Val Phe Val Lys Lys 
225 230 235 

GGC GAT CGC ATT AAA AAG GGC GAT TTG GTT TTT AGC ATT TCT AGC CCT 24 0 

Gly Asp Arg He Lys Lys Gly Asp Leu Val Phe Ser He Ser Ser Pro 
240 245 250 

GAA TTA GAA GCC AAG CTC GCT CAA GCT GAA GCC GGG CAT AAA GCC GCT 288 
Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
255 260 265 

AAA GCG CTT AGC GAT GAA GTC AAA AGA GGC TCA AGA GAC GAA ACG ATC 336 
Lys Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr He 
270 275 280 

T TCT GCA AGA GAC GTT TGG CAA GCG GCC AAA TCT CAA GCC ACT TTA 3 84 

.sn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
85 290 295 300 

GCC AAA GAG ACT TAT AAG CGC GTT CAA GAT TTG TAT GAT AAT GGC GTG 4 32 

Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
305 310 315 

GCG AGC TTG CAA AAG CGC GAT GAA GCC TAT GCG GCT TAT GAA AGC ACT 4 80 

Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
320 325 330 

AAA TAC AAC GAG AGC GCG GCT TAC CAA AAG TAT AAA ATG GCT TTA GGG 52 8 

Lys Tyr Asn Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
335 340 345 

GGG GCG AGC TCT GAA AGT AAG ATT GCC GCT AAG GCT AAA GAG AGC GCG 576 
Gly Ala Ser Ser Glu Ser Lys He Ala Ala Lys Ala Lys Glu Ser Ala 
350 355 360 

GCT TTA GGG CAA GTG AAT GAA GTG GAG TCT TAT TTA AAA GAT GTC AAA 624 
Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
^ 65 370 375 380 

:G ACA GCC CCA ATT GAT GGG GAA GTG AGT AAT GTG CTT TTA AGC GGT 672 
la Thr Ala Pro He Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
385 390 395 



GGC GAG CTT AGC CCT AAG GGC TTT CCT GTG GTG CTC ATG ATT GAT TTA 720 
Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met He Asp Leu 
400 405 410 

AAG GAT AGT TGG TTA AAA ATC AGC GTG CCT GAA AAG TAT TTG AAC GAT 768 
Lys Asp Ser Trp Leu Lys He Ser Val Pro Glu Lys Tyr Leu Asn Asp 
415 420 425 

TTT AAA GTG GGT AAG GAA TTT GAA GGT TAT ATC CCG GCG TTG AAA AGA 816 
Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr He Pro Ala Leu Lys Arg 
430 435 440 

AGC GCG AAA TTC AGG GTC AAA TAT TTG AGC GTG ATG GGG GAT TTT GCG 864 
Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
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445 450 455 460 

ACT TGG AAA GCG ACG AAT AAT TCC AAC ACT TAC GAC ATG AAA AGC TAT 912 
Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
465 470 475 

GAA GTG GAG GCC ATA CCC TTA GAA GAG TTG GAA AAT TTT AGG GTA GGG 960 
Glu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
480 485 490 

ATG AGC GTG TTA GTT ACC ATT AAA CCT TAA 990 
Met Ser Val Leu Val Thr lie Lys Pro * 
495 500 




(2) ANGABEN ZU SEQ ID NO: 90: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 330 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 90: 

Met Ser Asn Ser Met Leu Asp Lys Asn Lys Ala lie Leu Thr Gly Gly 
15 10 15 

Gly Ala Leu Leu Leu Gly Leu lie Val Leu Phe Tyr Leu Ala Tyr Arg 
20 25 30 

Pro Lys Ala Glu Val Leu Gin Gly Phe Leu Glu Ala Arg Glu Tyr Ser 
35 40 45 

Val Ser Ser Lys Val Pro Gly Arg lie Glu Lys Val Phe Val Lys Lys 
50 55 60 

Gly Asp Arg lie Lys Lys Gly Asp Leu Val Phe Ser lie Ser Ser Pro 
65 70 75 80 

Glu Leu Glu Ala Lys Leu Ala Gin Ala Glu Ala Gly His Lys Ala Ala 
85 90 95 

s Ala Leu Ser Asp Glu Val Lys Arg Gly Ser Arg Asp Glu Thr lie 
100 105 110 

Asn Ser Ala Arg Asp Val Trp Gin Ala Ala Lys Ser Gin Ala Thr Leu 
115 120 125 

Ala Lys Glu Thr Tyr Lys Arg Val Gin Asp Leu Tyr Asp Asn Gly Val 
130 135 140 

Ala Ser Leu Gin Lys Arg Asp Glu Ala Tyr Ala Ala Tyr Glu Ser Thr 
145 150 155 160 

Lys Tyr Aon Glu Ser Ala Ala Tyr Gin Lys Tyr Lys Met Ala Leu Gly 
165 170 175 

Gly Ala Ser Ser Glu Ser Lys lie Ala Ala Lys Ala Lys Glu Ser Ala 
180 185 190 

Ala Leu Gly Gin Val Asn Glu Val Glu Ser Tyr Leu Lys Asp Val Lys 
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195 200 205 

Ala Thr Ala Pro lie Asp Gly Glu Val Ser Asn Val Leu Leu Ser Gly 
210 215 220 

Gly Glu Leu Ser Pro Lys Gly Phe Pro Val Val Leu Met lie Asp Leu 
225 230 235 240 

Lys Asp Ser Trp Leu Lys lie Ser Val Pro Glu Lys Tyr Leu Asn Asp 
245 250 255 

Phe Lys Val Gly Lys Glu Phe Glu Gly Tyr lie Pro Ala Leu Lys Arg 
260 265 270 

Ser Ala Lys Phe Arg Val Lys Tyr Leu Ser Val Met Gly Asp Phe Ala 
275 280 285 



Thr Trp Lys Ala Thr Asn Asn Ser Asn Thr Tyr Asp Met Lys Ser Tyr 
290 295 300 



lu Val Glu Ala lie Pro Leu Glu Glu Leu Glu Asn Phe Arg Val Gly 
°5 310 315 320 



Met Ser Val Leu Val Thr lie Lys Pro * 
325 330 

(2) ANGABEN ZU SEQ ID NO: 91: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 684 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS091 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..684 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 91: 

ATG GTA TTT GAC AGA ACA ATC AGC GTA AGA GAA AAA AAA GCG GCT AAA 48 
Met Val Phe Asp Arg Thr lie Ser Val Arg Glu Lys Lys Ala Ala Lys 
335 340 345 

ACG CTT GGG ATT ATT GGG ATC GTC TTT TTT ATT TTG TTT GGC ATC GTG 96 
Thr Leu Gly lie lie Gly lie Val Phe Phe lie Leu Phe Gly lie Val 
350 355 360 

ATA AGC GGG GTG GCT TTT CAA AAA GAG TGG GTG CAA CAA TTG GAT TTA 144 
lie Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 
365 370 375 

TTT TTT ATA GAC TTG ATC CGC AAC CCT GCC CCC ATT CAA AAA AGC GCG 192 
Phe Phe lie Asp Leu lie Arg Asn Pro Ala Pro lie Gin Lys Ser Ala 
380 385 390 
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TGG CTT TCT TTC GTG TTT TTT AGC ACT TGG TTT GCA CAA AGC AAG CTC 24 0 

Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
395 400 405 410 

ACC ACT CCT ATA GCC TTA CTC ATT GGC TTG TGG TTT GGG TTT CAA AAA 2 88 

Thr Thr Pro lie Ala Leu Leu lie Gly Leu Trp Phe Gly Phe Gin Lys 
415 420 425 

CGC ATC GCT TTG GGG GTG TGG TTT TTC TTT AGC ATC TTA TTA GGT GAA 336 
Arg lie Ala Leu Gly Val Trp Phe Phe Phe Ser lie Leu Leu Gly Glu 
430 435 440 

TTC ACC TTA AAA TCC CTT AAG CTT TTA GTG GCG CGC CCA CGG CCT GTA 384 
Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
445 450 455 



ACC AAT GGC GAA TTG GTT TTC GCG CAT GGC TTT AGT TTC CCT AGC GGG 432 
Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
460 465 470 




T GCT TTG GCT TCA GCG CTT TTT TAG GGC TCT TTG GCG TTG TTG TTA 4 80 

is Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
475 480 485 490 

TGC TAT TCT AAC GCC AAC AAT CGC ATT AAA ACG ATT ATT GCT GTG GTT 52 8 

Cys Tyr Ser Asn Ala Asn Asn Arg lie Lys Thr lie lie Ala Val Val 
495 500 505 

TTG CTT TTT TGG ATT TTT TTA ATG GCG TAT GAT AGG GTT TAT TTA GGG 576 
Leu Leu Phe Trp lie Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
510 515 520 

GTG CAT TAC CCT AGC GAT GTT TTA GGA GGG TTT TTA TTA GGG ATT GCT 624 
Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly lie Ala 
525 530 535 

TGG TCG TGC TGC TCT TTA GCG CTT TAT TTA GGG TTT TTG AAA CGC CCT 672 
Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
540 545 550 

TAT AAT CAA TAA 684 
Tyr Asn Gin * 
55 

(2) ANGABEN ZU SEQ' ID NO: 92: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 228 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 92: 

Met Val Phe Asp Arg Thr lie Ser Val Arg Glu Lys Lys Ala Ala Lys 
1 5 10 15 

Thr Leu Gly lie He Gly He Val Phe Phe He Leu Phe Gly He Val 
20 25 30 

He Ser Gly Val Ala Phe Gin Lys Glu Trp Val Gin Gin Leu Asp Leu 



35 40 45 

Phe Phe lie Asp Leu lie Arg Asn Pro Ala Pro lie Gin Lys Ser Ala 
50 55 60 

Trp Leu Ser Phe Val Phe Phe Ser Thr Trp Phe Ala Gin Ser Lys Leu 
65 70 75 80 

Thr Thr Pro He Ala Leu Leu He Gly Leu Trp Phe Gly Phe Gin Lys 

85 90 95 

Arg He Ala Leu Gly Val Trp Phe Phe Phe Ser He Leu Leu Gly Glu 
100 105 110 

Phe Thr Leu Lys Ser Leu Lys Leu Leu Val Ala Arg Pro Arg Pro Val 
115 120 125 

Thr Asn Gly Glu Leu Val Phe Ala His Gly Phe Ser Phe Pro Ser Gly 
130 135 140 

is Ala Leu Ala Ser Ala Leu Phe Tyr Gly Ser Leu Ala Leu Leu Leu 
45 150 155 160 

Cys Tyr Ser Asn Ala Asn Asn Arg He Lys Thr He He Ala Val Val 
165 170 175 

Leu Leu Phe Trp He Phe Leu Met Ala Tyr Asp Arg Val Tyr Leu Gly 
180 185 190 

Val His Tyr Pro Ser Asp Val Leu Gly Gly Phe Leu Leu Gly He Ala 
195 200 205 

Trp Ser Cys Cys Ser Leu Ala Leu Tyr Leu Gly Phe Leu Lys Arg Pro 
210 215 220 

Tyr Asn Gin * 
225 

(2) ANGABEN ZU SEQ ID NO: 93: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 729 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 

(D) TOPOLOGIE : linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS095 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE : 1 . .729 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 93: 

ATG AAA AAA ATT TTT TCT CAA TCT TTG TTA GCT TTG GTT GTT TCT GTC 
Met Lys Lyo He Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
230 235 240 
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^^^32! 



AAT GCG CTA CTA GCT ATG GAT .GGT AAT GGC GTG TTT ATA GGG GCG GGT 96 
Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
245 250 255 260 

TAT TTG CAA GGA CAA GCC CAA ATG CAT GCG GAT ATT AAT TCT CAA AAA 144 
Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp lie Asn Ser Gin Lys 
265 270 275 

CAA GCC ACT AGC GCT ACT ATC AAG GGG TTT GAT GCG CTT TTA GGG TAT 192 
Gin Ala Thr Ser Ala Thr lie Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
280 285 290 

CAG TTT TTC TTT GGG AAA TAC TTT GGC TTA CGC CTT TAT GGG TTT TTT 24 0 

Gin Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
295 300 305 

GAC TAC GCC CAT GCC AAT TCT ATT AGG CTT AAA AAC CCT AAT TAT AAC 2 88 

Asp Tyr Ala His Ala Asn Ser lie Arg Leu Lys Asn Pro Asn Tyr Asn 
310 315 320 
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C GAA GTG GTG CAA TTG GCG GGT CAA GTT CTT GGG AAA CAA GAA ATC 336 
sn Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu lie 
325 330 335 340 

AAT CGT TTA ACG AGC CTT GCT GAT CCC AAA ACC TTT GAG CCA AAC ATG 3 84 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
345 350 355 

CTC ACT TAT GGG GGG GCT ATG GAT GTG ATG GTT AAT GTC ATr AAT AAT 432 
Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val lie Asn Asn 
360 365 370 

GGC ATC ATG AGT TTG GGG GCT TTT GGT GGG GTG CAA TTA GCC GGC AAT 480 
Gly lie Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
375 380 385 

TCA TGG CTT ATG GCG ACG CCG AGC TTT GAG GGC ATT TTA GTG GAG CAA 528 
Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly lie Leu Val Glu Gin 
390 395 400 

GCT TTG GTG AGC AAG AAA GCC ACT TCT TTC CAA TTT TTA TTC AAT GTG 576 
Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
\°5 410 415 420 



GCT CGC TTA AGG ATC TTA AAG CAT TCT AGC ATT GAA GCG GGC GTG 624 
Gly Ala Arg Leu Arg lie Leu Lys His Ser Ser lie Glu Ala Gly Val 
425 430 435 

AAG TTC CCC ATG TTA AAG AAA AAC CCC TAT ATC ACT GCA AAA AAC TTG 672 
Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr lie Thr Ala Lys Asn Leu 
440 445 450 

GAT ATA GGG TTT AGG CGC GTG TAT TCA TGG TAT GTG AAT TAT GTG TTC 72 0 

Asp He Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
455 460 465 

ACT TTC TAG 72 9 

Thr Phe * 
470 



(2) ANGABEN ZU SEQ ID NO: 94: 
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(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 243 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 94: 

Met Lys Lys lie Phe Ser Gin Ser Leu Leu Ala Leu Val Val Ser Val 
1 5 10 15 

Asn Ala Leu Leu Ala Met Asp Gly Asn Gly Val Phe lie Gly Ala Gly 
20 25 30 

Tyr Leu Gin Gly Gin Ala Gin Met His Ala Asp lie Asn Ser Gin Lys 
35 40 45 

Gin Ala Thr Ser Ala Thr lie Lys Gly Phe Asp Ala Leu Leu Gly Tyr 
50 55 60 

In Phe Phe Phe Gly Lys Tyr Phe Gly Leu Arg Leu Tyr Gly Phe Phe 
65 70 75 80 

Asp Tyr Ala His Ala Asn Ser lie Arg Leu Lys Asn Pro Asn Tyr Asn 

85 90 95 

Asn Glu Val Val Gin Leu Ala Gly Gin Val Leu Gly Lys Gin Glu lie 
100 105 110 

Asn Arg Leu Thr Ser Leu Ala Asp Pro Lys Thr Phe Glu Pro Asn Met 
115 120 125 

Leu Thr Tyr Gly Gly Ala Met Asp Val Met Val Asn Val He Asn Asn 
130 135 140 

Gly He Met Ser Leu Gly Ala Phe Gly Gly Val Gin Leu Ala Gly Asn 
145 150 155 160 

Ser Trp Leu Met Ala Thr Pro Ser Phe Glu Gly He Leu Val Glu Gin 
165 170 175 

Ala Leu Val Ser Lys Lys Ala Thr Ser Phe Gin Phe Leu Phe Asn Val 
180 185 190 

y Ala Arg Leu Arg He Leu Lys His Ser Ser He Glu Ala Gly Val 
195 200 205 

Lys Phe Pro Met Leu Lys Lys Asn Pro Tyr He Thr Ala Lys Asn Leu 
21° 215 220 

Asp He Gly Phe Arg Arg Val Tyr Ser Trp Tyr Val Asn Tyr Val Phe 
225 230 235 240 

Thr Phe * 



(2) ANGABEN ZU SEQ ID NO: 95: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 975 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: be ides 
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(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT: 
(B) CLON(E) : HPS099 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL : CDS 

(B) LAGE:1..975 




(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 95: 

ATG CCG GAA AAT TCT AAA CTA CAA CCT GCT AAG TTA GGG AAA AAT TTT 48 
Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
245 250 255 

GAC CCT GTG GAT CAT TCT AAC AGG AAT TTT TTC TTT TCT CTC ATT CTG 96 
sp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu He Leu 
|60 265 270 275 

TCT GTA TTG TTA CAC TGG TTG ATT TAT TTT TTA TTT GAA CAC AGA GAA 144 
Ser Val Leu Leu His Trp Leu He Tyr Phe Leu Phe Glu His Arg Glu 
280 285 290 

GAT TTT TTT CCT TCA AAA CCC AAG CTT GTT AAA TTA AAT CCT GAA AAT 192 
Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
295 300 305 

TTA TTG GTT TTA AAA AGA GGC CAT TCG CAA GAT CCC AGT AAA AAC ACC 240 
Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
310 315 320 

CAG GGC GCT CCT AAA CCC ACG CTG GCT GGC CCC CAA AAA CCT CCA ACG 288 
Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 
325 330 335 

CCT CCC ACA CCC CCA ACT CCG CCA ACC CCG CCA ACC CCG CCA AAA CCT 336 
Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
340 345 350 355 

A GAA AAG CCT AAG CCT GAG CCT AAA CCA AAA CCC AAA CCT GAA CCC 384 
e Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
360 365 370 

AAA AAG CCC AAT CAT AAA CAC AAG GCT CTT AAA AAA GTG GAA AAA GTG 432 
Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
375 380 385 

GAA GAG AAA AAA GTA GTA GAG GAG AAA AAA GAA GAG AAA AAA ATC GTA 4 80 

Glu Glu Lys Lys Val Val Glu Glu Lvs Lys Glu Glu Lys Lys He Val 
390 395 " 400 

GAG CAG AAA GTA GAA CAA AAA GTA GAG CAG AAA AAA ATA GAA GAG AAA 52 8 

Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys He Glu Glu Lys 
405 410 415 

AAA CCT GTC AAA AAA GAA TTT GAC CCT AAC CAG CTT TCT TTC TTG CCT 576 
Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
420 425 430 435 
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AAA GAA GTT GCG CCA CCC AGA CAA GAA AAT AAT AAA GGC TTG GAT AAC 624 
Lys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
440 445 450 

CAA ACC AGA AGG GAT ATT GAT GAA TTG TAT GGC GAA GAA TTT GGG GAT 672 
Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
455 460 465 

TTA GGC ACA GCC GAA AAA GAT TTC ATC AGG AAT AAT TTA AGG GAT ATT 720 
Leu Gly Thr Ala Glu Lys Asp Phe lie Arg Asn Asn Leu Arg Asp He 
470 475 480 

GGG CGC ATC ACG CAA AAA TAT TTA GAA TAC CCT CAA GTA GCG GCT TAT 768 
Gly Arg He Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
485 490 495 



TTA GGG CAG GAC GGG ACG AAT GCG GTA GAG TTT TAC TTG CAC CCT AAT 816 
Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
500 505 510 515 



C GAT ATT ACC GAT CTT AAA ATC ATC ATT GGC TCT GAA TAC AAA ATG 864 
ly Asp He Thr Asp Leu Lys He He He Gly Ser Glu Tyr Lys Met 
520 525 530 

CTT GAT GAC AAC ACC TTA AAG ACC ATT CAG ATC GCT TAT AAG GAT TAC 912 
Leu Asp Asp Asn Thr Leu Lys Thr He Gin He Ala Tyr Lys Asp Tyr 
535 540 545 

CCA CGC CCC AAA ACT AAA ACC CTC ATT CGC ATC AGA GTG CGT TAT TAC 960 
Pro Arg Pro Lys Thr Lys Thr Leu He Arg He Arg Val Arq Tyr Tvr 
550 555 560 

TTA GGG GGC AAT TAA 975 
Leu Gly Gly Asn * 
565 



(2) ANGABEN ZU SEQ ID NO: 96: 

(i) S EQUENZ KKNNZ E I CHEN : 

(A) LANGE: 325 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 96: 

Met Pro Glu Asn Ser Lys Leu Gin Pro Ala Lys Leu Gly Lys Asn Phe 
1 5 10 15 

Asp Pro Val Asp His Ser Asn Arg Asn Phe Phe Phe Ser Leu He Leu 
20 25 30 

Ser Val Leu Leu His Trp Leu He Tyr Phe Leu Phe Glu His Arg Glu 
35 40 45 

Asp Phe Phe Pro Ser Lys Pro Lys Leu Val Lys Leu Asn Pro Glu Asn 
50 55 60 

Leu Leu Val Leu Lys Arg Gly His Ser Gin Asp Pro Ser Lys Asn Thr 
65 70 75 80 
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Gin Gly Ala Pro Lys Pro Thr Leu Ala Gly Pro Gin Lys Pro Pro Thr 
85 90 95 

Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Thr Pro Pro Lys Pro 
100 105 110 

lie Glu Lys Pro Lys Pro Glu Pro Lys Pro Lys Pro Lys Pro Glu Pro 
115 120 125 

Lys Lys Pro Asn His Lys His Lys Ala Leu Lys Lys Val Glu Lys Val 
130 135 140 

Glu Glu Lys Lys Val Val Glu Glu Lys Lys Glu Glu Lys Lys lie Val 
145 150 155 160 

Glu Gin Lys Val Glu Gin Lys Val Glu Gin Lys Lys lie Glu Glu Lys 
165 170 175 

Lys Pro Val Lys Lys Glu Phe Asp Pro Asn Gin Leu Ser Phe Leu Pro 
180 185 190 

ys Glu Val Ala Pro Pro Arg Gin Glu Asn Asn Lys Gly Leu Asp Asn 
195 200 205 

Gin Thr Arg Arg Asp lie Asp Glu Leu Tyr Gly Glu Glu Phe Gly Asp 
210 215 220 

Leu Gly Thr Ala Glu Lys Asp Phe lie Arg Asn Asn Leu Arg Asp lie 
225 230 235 240 

Gly Arg lie Thr Gin Lys Tyr Leu Glu Tyr Pro Gin Val Ala Ala Tyr 
245 250 255 

Leu Gly Gin Asp Gly Thr Asn Ala Val Glu Phe Tyr Leu His Pro Asn 
260 265 270 

Gly Asp lie Thr Asp Leu Lys lie lie lie Gly Ser Glu Tyr Lys Met 
275 280 285 

Leu Asp Asp Asn Thr Leu Lys Thr lie Gin lie Ala Tyr Lys Asp Tyr 
290 295 300 

fcro Arg Pro Lys Thr Lys Thr Leu lie Arg lie Arg Val Arg Tyr Tyr 



(2) ANGABEN ZU SEQ ID NO: 97: 

{ i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 1290 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : be ides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON(E) : HPS117 (HPS118, HPS162) 




310 



315 



320 



Leu Gly Gly Asn * 
325 



(ix) MERKMAL: 
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(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1 . .1290 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 97: 

ATG CCA TAC GCC TTA AGA AAA AGA TTT TTC AAA CGC TTT GCG CTG ATT 48 
Met Pro Tyr Ala Leu Arg Lys Arg Phe Phe Lys Arg Phe Ala Leu He 
330 335 340 

GTT TCA ACT TTT TGT GCG ATA AGC TTG AAC GCT AAA AGC TAT CTG TTT 96 
Val Ser Thr Phe Cys Ala He Ser Leu Asn Ala Lys Ser Tyr Leu Phe 
345 350 355 

TCC CCT TTG CCC CCA GCA CAC CAG CAA ATC ATT AAG ACA GAG CCT TGC 144 
Ser Pro Leu Pro Pro Ala His Gin Gin He He Lys Thr Glu Pro Cys 
360 365 370 

TCT TTG GAA TGC TTG AAA GAC TTG ATG CTG CAA AAT CAA ATC TTT TCT 192 
■ser Leu Glu Cys Leu Lys Asp Leu Met Leu Gin Asn Gin He Phe Ser 
1 375 380 385 

TTT GTG TCT CAA TAC GAT AAC AAC AAC CAA GAT GAG AGC CTT AAA ACT 240 
Phe Val Ser Gin Tyr Asp Asn Asn Asn Gin Asp Glu Ser Leu Lys Thr 
390 395 400 405 

TAT TAT CAT GAC ATA CTC AAT AAA CTC AAC CCC GTA TTC ATC GCT TCT 2 88 

Tyr Tyr His Asp He Leu Asn Lys Leu Asn Pro Val Phe He Ala Ser 
410 415 420 

CAA ACT CCA GCT AAA GAA AGC TAT GAG CCT AAG ATT GAA TTA GCG GTT 336 
Gin Thr Pro Ala Lys Glu Ser Tyr Glu Pro Lys He Glu Leu Ala Val 
425 430 435 

TTA CTG CCT AAA AAG GTG GTG GGG CGT TAT GCG ATT TCG GTG ATG AAC 3 84 

Leu Leu Pro Lys Lys Val Val Gly Arg Tyr Ala He Ser Val Met Asn 
440 445 450 

ACC CTT TTA GCG TAT TTG AAC ACC AGA AAC AAC GAT TTC AAT ATC CAA 432 
Thr Leu Leu Ala Tyr Leu Asn Thr Arg Asn Asn Asp Phe Asn He Gin 
455 460 465 

[C TTT GAC AGC GAT GAA GAA AGC CCT GAA AAA TTA GAG CAA ACC TAT 480 
'1 Phe Asp Ser Asp Glu Glu Ser Pro Glu Lys Leu Glu Gin Thr Tyr 
0 475 480 . 485 

AAA GAA ATT GAA AAA GAA AAA TTC CCT TTT GTG ATA GCC TTA TTG ACT 52 8 

Lys Glu He Glu Lys Glu Lys Phe Pro Phe Val He Ala Leu Leu Thr 
490 495 500 

AAA GAG GGC GTG GAA AAT TTG CTC CAA AAC ACC ACC ATT AGC ACC CCT 57 6 

Lys Glu Gly Val Glu Asn Leu Leu Gin Asn Thr Thr He Ser Thr Pro 
505 510 515 

ACT TAT GTG CCT ACG GTG AAT AGA GCG CAA TTG GAA AAT CAA ACT GAA 624 
Thr Tyr Val Pro Thr Val Asn Arg Ala Gin Leu Glu Asn Gin Thr Glu 
520 525 530 

CGT TCT TTG AGC GAG CGC TTG TAT TTT GGG GGG ATT GAT TAT AAA GAG 672 
Arg Ser Leu Ser Glu Arg Leu Tyr Phe Gly Gly He Aep Tyr Lys Glu 
535 540 545 




148 




CAA TTA AGC ATG CTC ACG GCT TTC ATT AAC CCT AAT TCG CCC GTG ATT 
Gin Leu Ser Met Leu Thr Ala Phe lie Asn Pro Asn Ser Pro Val lie 
550 555 560 565 

GAA TAC GAT GAC GAT GGC CTA ATA GGT GAA CGC TTG AGG CAA ATC ACG 
Glu Tyr Asp Asp Asp Gly Leu He Gly Glu Arg Leu Arg Gin He Thr 
570 575 580 

GAG TCT TTA AGC ATT GAA GTC AAA CAC CAA GAA AAT ATT TCT TAC AAG 
Glu Ser Leu Ser He Glu Val Lys His Gin Glu Asn He Ser Tyr Lys 
585 590 595 

CAA GCC ACG AGT TTT TCT AAA AAT TTT AGA AAA AAC GAT GCG TTT TTT 
Gin Ala Thr Ser Phe Ser Lys Asn Phe Arg Lys Asn Asp Ala Phe Phe 
600 605 610 

AAA AAT TCT ATT TTG ATT TTA AAC ACC CCT ACC ACT AAA AGC GGC CTT 
Lys Asn Ser He Leu He Leu Asn Thr Pro Thr Thr Lys Ser Gly Leu 
615 620 625 

TT CTT TCT CAA ATA GGG CTT TTA GAA TAC AAG CCT CTT AAA ATC CTT 
le Leu Ser Gin He Gly Leu Leu Glu Tyr Lys Pro Leu Lys He Leu 
630 635 640 645 

TCC ACA CAA ATC AAT TTC AAC CCC TCT CTA CTC TTA CTC ACC CAA CCT 
Ser Thr Gin He Asn Phe Asn Pro Ser Leu Leu Leu Leu Thr Gin Pro 
650 655 660 

AAA GAC AGA AAG GAT TTA TTC ATT GTC AAT GCC TTG CAA AAT AGC GAT 
Lys Asp Arg Lys Asp Leu Phe He Val Asn Ala Leu Gin Asn Ser Asp 
665 670 675 

GAA ACG CTT ATA GAA TAC GCC TCC TTA TTG GAG AGC GAT TTA AGG CAT 
Glu Thr Leu He Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
680 685 690 

GAT TGG GTG AAT TAT TCC AGC GCA ATC GGG CTA GAG GTG TTT TTA AAC 
Asp Trp Val Asn Tyr Ser Ser Ala He Gly Leu Glu Val Phe Leu Asn 
695 700 705 



ACG CTA GAT CCG CAT TTT AAA AAA TCT TTT CAA GAG AAT TTA GAA GAC 
Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 

715 720 725 

lT CAG GTC CGT TAC CAC AAT CAA ATT TAT CAG GCT TTA GGG TAT TCT 
>sn Gin Val Arg Tyr His Asn Gin He Tyr Gin Ala Leu Gly Tyr Ser 
730 735 740 

TTT GAG CCA ATA AAA AAT GAA AGC GGA ACA AAA AAA GAA TAA 
Phe Glu Pro He Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
745 750 755 



(2) ANGABEN ZU SEQ ID NO: 98: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 4 30 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

<ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 98: 



Met Pro Tyr Ala 
1 



Val Ser Thr Phe 
20 

Ser Pro Leu Pro 
35 



Ser Leu Glu Cys 
50 

Phe Val Ser Gin 
65 



Tyr Tyr His Asp 



Gin Thr Pro Ala 
100 

eu Leu Pro Lys 
115 

Thr Leu Leu Ala 
130 

Val Phe Asp Ser 
145 



Lys Glu lie Glu 



Lys Glu Gly Val 
180 

Thr Tyr Val Pro 
195 



Arg Ser Leu Ser 
210 




lri Leu Ser Met 
£5 



Glu Tyr Asp Asp 



Glu Ser Leu Ser 
260 

Gin Ala Thr Ser 
275 



Lys Asn Ser lie 
290 



lie Leu Ser Gin 
305 



Ser Thr Gin lie 



Leu Arg Lys Arg 
5 



Cys Ala lie Ser 



Pro Ala His Gin 
40 

Leu Lys Asp Leu 
55 



Tyr Asp Asn Asn 
70 

lie Leu Asn Lys 
85 

Lys Glu Ser Tyr 



Lys Val Val Gly 
120 

Tyr Leu Asn Thr 
135 

Asp Glu Glu Ser 
150 

Lys Glu Lys Phe 
165 

Glu Asn Leu Leu 



Thr Val Asn Arg 
200 

Glu Arg Leu Tyr 
215 

Leu Thr Ala Phe 
230 

Asp Gly Leu lie 
245 

lie Glu Val Lys 



Phe Ser Lys Asn 
280 

Leu lie Leu Asn 
295 

lie Gly Leu Leu 
310 

Asn Phe Asn Pro 
325 



149 



Phe Phe Lys Arg 
10 



Leu Asn Ala Lys 
25 

Gin He He Lys 



Met Leu Gin Asn 
60 

Asn Gin Asp Glu 
75 



Leu Asn Pro Val 
90 

Glu Pro Lys He 
105 

Arg Tyr Ala He 



Arg Asn Asn Asp 
140 

Pro Glu Lys Leu 
155 

Pro Phe Val He 
170 

Gin Asn Thr Thr 
185 

Ala Gin Leu Glu 



Phe Gly Gly He 
220 

He Asn Pro Asn 
235 

Gly Glu Arg Leu 
250 

His Gin Glu Asn 
265 

Phe Arg Lys Asn 



Thr Pro Thr Thr 
300 

Glu Tyr Lys Pro 
315 

Ser Leu Leu Leu 
330 



Phe Ala Leu He 
15 

Ser Tyr Leu Phe 
30 

Thr Glu Pro Cys 
45 

Gin He. Phe Ser 



Ser Leu Lys Thr 
80 

Phe He Ala Ser 
95 

Glu Leu Ala Val 
110 

Ser Val Met Asn 
125 

Phe Asn He Gin 



Glu Gin Thr Tyr 
160 

Ala Leu Leu Thr 
175 

He Ser Thr Pro 
190 



Asn Gin Thr Glu 
205 



Asp Tyr Lys Glu 



Ser Pro Val He 
240 

Arg Gin He Thr 
255 

He Ser Tyr Lys 
270 

Asp Ala Phe Phe 
285 



Lys Ser Gly Leu 



Leu Lys He Leu 
320 

Leu Thr Gin Pro 
335 
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Lys Asp Arg Lys Asp Leu Phe He Val Asn Ala Leu Gin Asn Ser Asp 
340 345 350 

Glu Thr Leu He Glu Tyr Ala Ser Leu Leu Glu Ser Asp Leu Arg His 
355 360 365 

Asp Trp Val Asn Tyr Ser Ser Ala He Gly Leu Glu Val Phe Leu Asn 
370 375 380 

Thr Leu Asp Pro His Phe Lys Lys Ser Phe Gin Glu Asn Leu Glu Asp 
385 390 395 400 

Asn Gin Val Arg Tyr His Asn Gin He Tyr Gin Ala Leu Gly Tyr Ser 
405 410 415 

Phe Glu Pro He Lys Asn Glu Ser Gly Thr Lys Lys Glu * 
420 425 430 



(2) ANGABEN ZU SEQ ID NO: 99: 



(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1644 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS121 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1644 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 99: 



ATG 
Met 


GAT 
Asp 


AAA 
Lys 


AAC 
Asn 


AAC 
Asn 
435 


AAT 
Asn 


AAT 
Asn 


CTC 
Leu 


CGC 
Arg 


TTG 
Leu 
440 


ATT 
He 


TTA 
Leu 


GCG 
Ala 


ATC 
He 


GCT 
Ala 
445 


CTG 
Leu 


48 




TTC 
Phe 


TTG 
Leu 


TTT 
Phe 
450 


ATC 
He 


GCT 
Ala 


CTT 
Leu 


TAT 
Tyr 


AGC 
Ser 
455 


TAT 
Tyr 


TTT 
Phe 


TTC 
Phe 


CAA 
Gin 


AAA 
Lys 
460 


CCA 
Pro 


AAC 
Asn 


96 


AAA 
Lys 


ACA 
Thr 


ACA 
Thr 
465 


ACC 
Thr 


CAA 
Gin 


ACC 
Thr 


ACA 
Thr 


AAG 
Lys 
470 


CAA 
Gin 


GAA 
Glu 


ACA 
Thr 


ACC 
Thr 


AAC 
Asn 
475 


AAC 
Asn 


CAT 
His 


ACA 
Thr 


144 


GCA 
Ala 


ACA 
Thr 
480 


AGT 

Ser 


CCT 
Pro 


AAC 
Asn 


GCG 
Ala 


CCC 
Pro 
485 


AAC 
Asn 


GCC 
Ala 


CAA 
Gin 


CAT 
His 


TTT 
Phe 
490 


AGC 
Ser 


ACC 
Thr 


ACT 
Thr 


CAA 
Gin 


192 


ACA 
Thr 
495 


ACC 
Thr 


CCC 
Pro 


CAA 
Gin 


GAG 
Glu 


AAT 
Asn 
500 


TTG 
Leu 


CTA 
Leu 


AGC 
Ser 


ACG 
Thr 


ATT 
He 
505 


TCT 
Ser 


TTT 
Phe 


GAG 
Glu 


CAT 
His 


GCC 
Ala 
510 


240 


AGG 
Arg 


ATT 
He 


GAA 
Glu 


ATT 
He 


GAT 
Asp 
515 


TCT 
Ser 


TTA 
Leu 


GGG 
Gly 


CGC 
Arg 


ATC 
He 
520 


AAA 
Lys 


CAG 
Gin 


GTT 
Val 


TAT 
Tyr 


CTC 
Leu 
525 


AAG 
Lys 


288 




GAT AAA AAG TAT CTA ACC CCT AAA CAA AAG GGC TTT TTA GAG CAT GTG 
Asp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
530 535 540 

GGC CAT CTT TTT AGC TCC AAA GAA AAC GCG CAA CCC CCC CTA AAA GAG 
Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
545 550 555 

CTC CCC CTT TTA GCA GCC GAT AAA CTC AAG CCT TTA GAA GTG CGT TTT 
Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
560 565 570 

TTA GAC CCT ACG CTC AAT AAC AAA GCG TTC AAC ACC CCT TAT AGC GCT 
Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
575 580 585 .590 

TCA AAA .CC ACT CTT GGG CCT AAC GAA CAG CTT GTT TTA ACC CAA GAT 
Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
595 600 605 

TA GGC ACT CTT AGC ATC ATT AAA ACC CTG ACT TTC TAT GAT GAT TTG 
eu Gly Thr Leu Ser He He Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
610 615 620 

CAT TAT GAT TTA AAA ATC GCA TTC AAA TCG CCC AAT AAC CTT ATC CCT 
His Tyr Asp Leu Lys He Ala Phe Lys Ser Pro Asn Asn Leu He Pro 
625 630 635 

AGC TAT GTG ATC ACC AAT GGT TAC AGG CCG GTG GCT GAT TTG GAC AGC 
Ser Tyr Val He Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
640 645 650 

TAC ACC TTT TCA GGC GTG CTT TTA GAA AAT AGC GAC AAA AAA ATT GAA 
Tyr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys He Glu 
655 660 665 670 

AAA ATT GAA GAT AAA GAC GCT AAA GAA ATC AAA CGC TTT TCT AAC ACC 
Lys He Glu Asp Lys Asp Ala Lys Glu He Lys Arg Phe Ser Asn Thr 
675 680 685 

CTC TTT TTA TCC AGC GTG GAT AGG TAT TTC ACC ACC TTG CTT TTC ACT 
T ieu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
* 690 695 700 



GAT CCT CAA GGT TTT GAA GCC TTA ATT GAT TCA GAA ATC GGC ACT 
Lys Asp Pro Gin Gly Phe Glu Ala Leu He Asp Ser Glu He Gly Thr 
705 710 715 

AAA AAC CCC TTA GGG TTC ATT TCC CTT AAA AAT GAA GCG AAT TTG CAT 
Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
720 725 730 

GGC TAT ATT GGC CCT AAG GAT TAC CGC TCT TTG AAA GCG ATT TCA CCC 
Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
735 740 745 750 

ATG CTC ACC GAT GTG ATA GAG TAT GGC TTA ATC ACT TTC TTT GCA AAA 
Met Leu Thr Asp Val He Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
755 760 765 



GGC GTG TTT GTT TTA CTG GAT TAT TTG TAT CAA TTC GTG GGC AAT TGG 
Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
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770 775 780 

GGT TGG GCT ATC ATT CTT TTA ACG ATT ATC GTG CGC ATC ATC CTT TAT 1104 
Gly Trp Ala He lie Leu Leu Thr He He Val Arg He He Leu Tyr 
785 790 795 

CCT TTA AGC TAT AAG GGC ATG GTG AGC ATG CAA AAG CTC AAA GAA TTA 1152 
Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
800 805 810 

GCC CCT AAA ATG AAA GAA CTC CAA GAA AAA TAC AAG GGC GAA CCC CAA 1200 
Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
815 820 825 830 

AAA TTG CAA GCC CAC ATG ATG CAG CTT TAC AAA AAA CAT GGG GCT AAC 1248 
Lys Leu Gin Ala His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
835 840 845 



•t 



CCA CTA GGG GGT TGT CTG CCC TTA ATC TTA CAA ATC CCG GTG TTT TTT 1296 
ro Leu Gly Gly Cys Leu Pro Leu He Leu Gin He Pro Val Phe Phe 
850 855 860 




GCC ATT TAT AGA GTG CTT TAT AAC GCT GTG GAA TTG AAA AGC TCA GAG 1344 
Ala lie Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
865 870 875 

TGG ATC TTA TGG ATT CAT GAT TTA TCC ATC ATG GAT CCG TAT TTT ATT 1392 
Trp He Leu Trp He His Asp Leu Ser He Met Asp Pro Tyr Phe He 
880 885 890 

TTA CCG CTT CTT ATG GGA GCG TCT ATG TAT TGG CAC CAA AGC GTT ACG 144 0 

Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
895 900 905 910 

CCA AAC ACC ATG ACC GAT CCC ATG CAA GCA AAG ATT TTT AAA CTC TTA 1488 
Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys He Phe Lys Leu Leu 
915 920 925 

CCC CTA TTA TTC ACA ATC TTT TTA ATC ACT TTC CCG GCA GGG TTA GTC 153 6 

Pro Leu Leu Phe Thr He Phe Leu He Thr Phe Pro Ala Gly Leu Val 
930 935 940 

£TG TAT TGG ACC ACG AAC AAC ATC CTT TCG GTG TTG CAA CAA CTC ATC 1584 
u Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He 
945 950 955 

ATC AAT AAA GTC TTA GAG AAT AAA AAA CGC ATG CAT GCG CAA AAC AAA 1632 
He Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
960 965 970 

AAG GAA CAT TGA 1644 

Lys Glu His * 

975 



(2) ANGABEN ZU SEQ ID NO: 100: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 548 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 
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<ii) ART DES MOLEKULS: Protein 
(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 100: 

Met Asp Lys Asn Asn Asn Asn Leu Arg Leu lie Leu Ala lie Ala Leu 
1 5 10 15 

Ser Phe Leu Phe lie Ala Leu Tyr Ser Tyr Phe Phe Gin Lys Pro Asn 
20 25 30 

Lys Thr Thr Thr Gin Thr Thr Lys Gin Glu Thr Thr Asn Asn His Thr 
35 40 45 

Ala Thr Ser Pro Asn Ala Pro Asn Ala Gin His Phe Ser Thr Thr Gin 
50 55 60 

Thr Thr Pro Gin Glu Asn Leu Leu Ser Thr lie Ser Phe Glu His Ala 
65 70 75 80 

Arg lie Glu lie Asp Ser Leu Gly Arg lie Lys Gin Val Tyr Leu Lys 

85 90 95 

sp Lys Lys Tyr Leu Thr Pro Lys Gin Lys Gly Phe Leu Glu His Val 
100 105 110 

Gly His Leu Phe Ser Ser Lys Glu Asn Ala Gin Pro Pro Leu Lys Glu 
115 120 125 

Leu Pro Leu Leu Ala Ala Asp Lys Leu Lys Pro Leu Glu Val Arg Phe 
130 135 140 

Leu Asp Pro Thr Leu Asn Asn Lys Ala Phe Asn Thr Pro Tyr Ser Ala 
145 150 155 160 

Ser Lys Thr Thr Leu Gly Pro Asn Glu Gin Leu Val Leu Thr Gin Asp 
165 170 175 

Leu Gly Thr Leu Ser lie lie Lys Thr Leu Thr Phe Tyr Asp Asp Leu 
180 185 190 

His Tyr Asp Leu Lys lie Ala Phe Lys Ser Pro Asn Asn Leu lie Pro 
195 200 205 

ir Tyr Val lie Thr Asn Gly Tyr Arg Pro Val Ala Asp Leu Asp Ser 
I 210 215 220 

I'yr Thr Phe Ser Gly Val Leu Leu Glu Asn Ser Asp Lys Lys lie Glu 
22 5 230 235 240 

Lys lie Glu Asp Lys Asp Ala Lys Glu lie Lys Arg Phe Ser Asn Thr 
245 250 255 

Leu Phe Leu Ser Ser Val Asp Arg Tyr Phe Thr Thr Leu Leu Phe Thr 
260 265 270 

Lys Asp Pro Gin Gly Phe Glu Ala Leu lie Asp Ser Glu He Gly Thr 
275 280 285 

Lys Asn Pro Leu Gly Phe He Ser Leu Lys Asn Glu Ala Asn Leu His 
290 295 300 

Gly Tyr He Gly Pro Lys Asp Tyr Arg Ser Leu Lys Ala He Ser Pro 
3 °5 310 315 320 



154 

Met Leu Thr Asp Val He Glu Tyr Gly Leu He Thr Phe Phe Ala Lys 
325 330 335 

Gly Val Phe Val Leu Leu Asp Tyr Leu Tyr Gin Phe Val Gly Asn Trp 
340 345 350 

Gly Trp Ala He He Leu Leu Thr He He Val Arg He He Leu Tyr 
355 360 365 

Pro Leu Ser Tyr Lys Gly Met Val Ser Met Gin Lys Leu Lys Glu Leu 
370 375 380 

Ala Pro Lys Met Lys Glu Leu Gin Glu Lys Tyr Lys Gly Glu Pro Gin 
385 390 395 400 

Lys Leu Gin Ala. His Met Met Gin Leu Tyr Lys Lys His Gly Ala Asn 
405 410 415 

Pro Leu Gly Gly Cys Leu Pro Leu He Leu Gin He Pro Val Phe Phe 
420 425 430 

la He Tyr Arg Val Leu Tyr Asn Ala Val Glu Leu Lys Ser Ser Glu 
435 440 445 

Trp He Leu Trp He His Asp Leu Ser He Met Asp Pro Tyr Phe He 
450 455 460 

Leu Pro Leu Leu Met Gly Ala Ser Met Tyr Trp His Gin Ser Val Thr 
465 470 475 480 

Pro Asn Thr Met Thr Asp Pro Met Gin Ala Lys He Phe Lys Leu Leu 
485 490 495 

Pro Leu Leu Phe Thr He Phe Leu He Thr Phe Pro Ala Gly Leu Val 
500 505 510 

Leu Tyr Trp Thr Thr Asn Asn He Leu Ser Val Leu Gin Gin Leu He 
515 520 525 

He Asn Lys Val Leu Glu Asn Lys Lys Arg Met His Ala Gin Asn Lys 
530 535 540 

s Glu His * 
5 

(2) ANGABEN ZU SEQ ID NO: 101: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 3063 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
<B) CLON(E) : HPS132 



(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE : 1 . .3063 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 101: 

ATG ATG CTC GCT TCC ATT ATT GAA TTT TCC TTA CGC CAA AGA GTG ATC 4 8 

Met Met Leu Ala Ser lie lie Glu Phe Ser Leu Arg Gin Arg Val lie 
550 555 560 

GTG ATT GTT GGT GCG ATT CTT ATT TTA TTT TTT GGG ACT TAT AGT TTT 96 
Val lie Val Gly Ala lie Leu lie Leu Phe Phe Gly Thr Tyr Ser Phe 
565 570 575 580 

ATC AAC ACT CCA GTG GAC GCT TTC CCG GAT ATT TCG CCC ACT CAA GTT 144 
lie Asn Thr Pro Val Asp Ala Phe Pro Asp lie Ser Pro Thr Gin Val 
585 590 595 

AAA ATC ATT TTA AAA CTC CCC GGC TCT AGC CCT GAA GAA ATG GAA AAC 192 
Lys lie lie Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
600 605 610 

AAC ATC GTG CGC CCT TTA GAA TTG GAG CTT TTA GGC TTG AAA GGG CAA 24 0 

sn lie Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
615 620 625 

AAA TCT TTA AGG AGT GTT TCA AAA TAT TCT ATT TCA GAT ATT ACG ATA 288 
Lys Ser Leu Arg Ser Val Ser Lys Tyr Ser lie Ser Asp lie Thr lie 
630 635 640 

GAT TTT GAT GAC AGC GTG GAT ATT TAT TTA GCG AGG AAT ATT GTC AAT 336 
Asp Phe Asp Asp Ser Val Asp lie Tyr Leu Ala Arg Asn lie Val Asn 
645 650 655 660 

GAG CGC TTG AGC AGC GTG ATG AAA GAT TTA CCC GTG GGG GTT GAG GGG 3 84 

Glu Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
665 670 675 

GGC ATG GCG CCC ATT GTT ACG CCG CTA TCA GAT ATC TTT ATG TTC ACT 432 
Gly Met Ala Pro lie Val Thr Pro Leu Ser Asp lie Phe Met Phe Thr 
680 685 690 

ATT GAT GGC AAT ATC ACT GAG ATA GAA AAA CGA CAG CTT TTA GAT TTT 480 
lie Asp Gly Asn lie Thr Glu lie Glu Lys Arg Gin Leu Leu Asp Phe 
695 700 705 



• 



G ATC CGC CCA CAA TTA AGA ATG ATT AGC GGC GTA GCA GAT GTC AAT 528 
1 lie Arg Pro Gin Leu Arg Met lie Ser Gly Val Ala Asp Val Asn 
710 715 720 



TCC ATT GGA GGC TTT AGC AGA GCG TTT GTG ATC GTG CCG GAT TTT AAT 576 
Ser lie Gly Gly Phe Ser Arg Ala Phe Val lie Val Pro Asp Phe Asn 
725 730 735 740 

GAC ATG GCA AGG CTT GGG GTG AGT ATT TCT GAT TTA GAA TCG GCT GTG 624 
Asp Met Ala Arg Leu Gly Val Ser lie Ser Asp Leu Glu Ser Ala Val 
745 750 755 

AGA GTG AAT TTA AGA AAC AGC GGA GCG GGG CGC GTG GAT AGA GAT GGC 672 
Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
760 765 770 

GAA ACC TTT TTA GTC AAA ATC CAA ACC GCT TCT TTG AGT TTA GAA GAC 72 0 

Glu Thr Phe Leu Val Lys lie Gin Thr Ala Ser Leu Ser Leu Glu Asp 
775 780 785 
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ATT GGC AAA ATC ACC GTT TCC ACT AAT TTA GGG CAT TTG CAC ATT AAG 768 
lie Gly Lys lie Thr Val Ser Thr Asn Leu Gly His Leu His lie Lys 
790 795 800 

GAT TTT GCG AAA GTC ATC AGC CAG TCT CGC ACC CGT TTG GGG TTT GTT 816 
Asp Phe Ala Lys Val lie Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
805 810 815 820 

ACT AAA GAT GGC GTG GGC GAG ACC ACA GAA GGC TTG GTG CTT TCT TTA 864 
Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
825 830 835 

AAA GAC GCT AAC ACC AAA GAA ATC ATC ACT CAA GTG TAT CAA AAA CTA 912 
Lys Asp Ala Asn Thr Lys Glu He He Thr Gin Val Tyr Gin Lys Leu 
840 845 850 

GAA GAA TTA AAA CCC TTT TTA CCG AAT GGC GTG TCC ATT AAT GTT TTT 960 
Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser He Asn Val Phe 
855 860 865 

AT GAT CGC TCA GAA TTT ACG CAA AAA GCC ATT GCC ACC GTT TCT AAA 1008 
yr Asp Arg Ser Glu Phe Thr Gin Lys Ala He Ala Thr Val Ser Lys 
870 875 880 

ACC CTC ATT GAA GCC GTT GTT TTA ATC ATC ATC ACG CTC TTT TTA TTT 1056 
Thr Leu He Glu Ala Val Val Leu He He He Thr Leu Phe Leu Phe 
885 890 895 900 

TTA GGG AAT TTG AGG GCG AGC GTG GCT GTG GGG GTG ATT TTA CCT TTA 1104 
Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val He Leu Pro Leu 
905 910 915 

AGC TTG TCC GTG GCG TTT ATT TTT ATC AAG TTT AGC GAT CTG ACT TTA 1152 
Ser Leu Ser Val Ala Phe He Phe He Lys Phe Ser Asp Leu Thr Leu 
920 925 930 

AAT TTG ATG AGT TTA GGG GGA TTG GTT ATC GCT ATA GGC ATG CTC ATT 12 00 

Asn Leu Met Ser Leu Gly Gly Leu Val lie Ala He Gly Met Leu He 
935 940 945 



m As; 



GAC TCA GCC GTG GTG GTG GTG GAA AAC GCT TTT GAA AAA TTA AGC GCT 124 8 

Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
950 955 960 



C ACT AAA ACC ACT AAA CTC CAT GCA ATC TAT CGT TCG TGT AAA GAA 12 96 

sn Thr Lys Thr Thr Lys Leu His Ala He Tyr Arg Ser Cys Lys Glu 
965 970 975 980 

ATC GCT GTT TCA GTG GTG AGC GGG GTG GTG ATC ATC ATT GTG TTT TTT 1344 
He Ala Val Ser Val Val Ser Gly Val Val He He He Val Phe Phe 
985 990 995 

GTG CCG ATT TTA ACC TTA CAG GGG TTA GAG GGT AAG ATG TTT AGG CCT 13 92 

Val Pro He Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
1000 1005 1010 

TTA GCG CAA AGC ATT GTG TAT GCG CTT TTA GGC ACT TTA GTT CTA TCT 1440 
Leu Ala Gin Ser He Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
1015 1020 1025 

ATT ACA ATC ATT CCT GTA GTC AGC TCT CTT GTC TTA AAA GCC ACG CCC 14 88 

He Thr He He Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 
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1030 1035 1040 

CAT AGC GAA ACC TTT TTA ACG AGG TTT TTA AAC AGA ATC TAC GCC CCT 1536 
His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg lie Tyr Ala Pro 
1045 1050 1055 1060 

TTA TTG GAA TTT TTT GTG CAT AAC CCT AAA AAA GTG ATT TTA GGA GCG 1584 
Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val lie Leu Gly Ala 
1065 1070 1075 

TTT GTT TTT TTA ATC GCA AGC CTT TCT TTA TTC CCT TTT GTG GGG AAG 1632 
Phe Val Phe Leu lie Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
1080 1085 1090 

AAT TTC ATG CCC GTT TTA GAT GAG GGC GAT GTG GTT TTG AGC GTG GAA 1680 
Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
1095 1100 1105 

ACC ACC CCT TCT ATT TCT TTA GAT CAA TCT AGG GAT CTC ATG CTA AAC 1728 
'hr Thr Pro Ser lie Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
1110 1115 1120 

ATT GAG AGC GCG ATT AAA AAG CAT GTC AAG GAA GTT AAA AGC ATT GTC 1776 
lie Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser lie Val 
1125 1130 1135 1140 

GCG CGC ACA GGG AGC GAT GAA TTG GGG CTG GAT TTA GGA GGT TTG AAT 1824 
Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
1145 1150 1155 

CAA ACC GAT ACT TTT ATT TCT TTT ATT CCT AAA AAA GAA TGG AGC GTT 1872 
Gin Thr Asp Thr Phe lie Ser Phe lie Pro Lys Lys Glu Trp Ser Val 
1160 1165 1170 

AAA ACC AAA GAT GAA TTA TTA GAA AAA ATC ATG GAT TCT TTA AAA GAC 1920 
Lys Thr Lys Asp Glu Leu Leu Glu Lys lie Met Asp Ser Leu Lys Asp 
1175 1180 1185 

TTT AAG GGG ATT AAC TTT TCT TTC ACC CAA CCC ATT GAA ATG AGA ATT 1968 
Phe Lys Gly lie Asn Phe Ser Phe Thr Gin Pro lie Glu Met Arg lie 
1190 1195 1200 

T GAA ATG CTG ACA GGG GTT AGG GGG GAT TTA GCG GTT AAG ATT TTT 2016 
r Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys lie Phe 
05 1210 1215 1220 

GGA GAT GGT ATT AGC GAA TTG AAT GAA TTG AGT TTT CAA ATC GCG CAA 2064 
Gly Asp Gly lie Ser Glu Leu Asn Glu Leu Ser Phe Gin lie Ala Gin 
1225 1230 1235 

GCT CTA AAA GGG ATT AAA GGA TCT AGT GAA GTT TTA ACC ACG CTT AAT 2112 
Ala Leu Lys Gly lie Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
1240 1245 1250 

GAG GGC GTG AAT TAT TTG TAT GTA ACC CCT AAT AAA GAA TCG ATG GCG 216 0 

Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
1255 1260 1265 

GAT GTG GGG ATC ACT AGC GAT GAA TTT TCC AAG TTT TTA AAA TCC GCT 220 8 

Asp Val Gly lie Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
1270 1275 1280 
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TTA GAG GGC TTG GTT GTA GAT GTG ATC OCT ACA GGG ATT TCA CGC ACG 2256 
Leu Glu Gly Leu Val Val Asp Val lie Pro Thr Gly lie Ser Arg Thr 
.1285 1290 1295 1300 

CCA GTG ATG ATC CGC CAA GAG AGC GAT TTT GCA AGC TCT ATC ACT AAA 23 04 

Pro Val Met lie Arg Gin Glu Ser Asp Phe Ala Ser Ser lie Thr Lys 
1305 1310 1315 

ATC AAA AGT TTA GCC TTG ACT TCA AAA TAT GGC GTT TTA GTG CCT ATC 2352 
lie Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro He 
1320 1325 1330 

ACT TCT ATC GCC AAA ATT GAA GAA GTG GAT GGC CCT GTT TCT GTT GTG 2400 
Thr Ser He Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
1335 1340 1345 



T -3 



CGT GAA AAT TCA ATG CGC ATG AGC GTG GTT CGC AGT AAT GTG GTG GGG 244 8 

Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
1350 1355 1360 




GC GAT TTG AAA TCT TTT GTA GAA GAG GCT AAA AAA GTG ATC GCT CAA 2496 
g Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
13 65 1370 1375 1380 

AAC ATC AAA CTC CCT CCC AGC TAC TAT ATC ACT TAT GGG GGG CAG TTT 2544 
Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
1385 1390 1395 

GAA AAC CAG CAA CGG GCC AAT AAA AGG CTC TCC ACC GTT ATC CCT TTA 2592 
Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
1400 1405 1410 

AGC ATC TTA GCG ATT TTT TTC ATT CTT TTT TTC ACT TTT AAA AGC ATT 264 0 

Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
1415 1420 1425 

CCT TTA GCC TTG CTC ATT CTT TTG AAT ATC CCT TTT GCG GTT ACC GGA 2688 
Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
1430 1435 1440 

GGC CTT ATT GCG TTG TTT GCG GTC GGG GAG TAT ATT TCA GTG CCA GCG 2736 
Gly Leu He Ala Leu Phe Ala Val Gly Glu Tyr He Ser Val Pro Ala 
' 45 1450 1455 1460 

C GTG GGC TTT ATC GCT CTT TTT GGG ATT GCG GTT TTA AAT GGC GTG 2784 
Ser Val Gly Phe He Ala Leu Phe Gly He Ala Val Leu Asn Gly Val 
1465 1470 1475 

GTG ATG ATA GGC TAT TTT AAA GAG CTT CTC TTG CAA GGG AAA AGC GTA 2 832 

Val Met He Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
1480 1485 1490 

GAA GAA TGC GTT TTA TTG GGC GCT AAA AGG CGT TTG AGA CCG GTT TTA 2 880 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
3-495 1500 1505 

ATG ACC GCT TGC ATT GCC GGT TTG GGT TTG CTC CCT TTA TTA TTT TCT 2 92 8 

Met Thr Ala Cys He Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
1510 1515 1520 



CAT AGC GTG GGA TCA GAA GTC CAA AAA CCT 
His Ser Val Gly Ser Glu Val Gin Lys Pro 



TTA GCG ATC . GTG GTG CTT 
Leu Ala He Val Val Leu 



2976 
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1525 1530 1535 1540 

GGA GGC TTG GTT ACC TCA AGC GCT CTA ACC TTA CTC CTA CTG CCG CCA 3024 
Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
1545 1550 1555 

ATG TTT ATG CTC ATC GCT AAA AAG ATT AAA ATC GTT TGA 3 063 

Met Phe Met Leu lie Ala Lys Lys lie Lys lie Val * 
1560 1565 

(2) ANGABEN ZU SEQ ID NO: 102: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 1021 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 102: 

t Met Leu Ala Ser lie lie Glu Phe Ser Leu Arg Gin Arg Val lie 
1 5 10 15 

Val lie Val Gly Ala lie Leu lie Leu Phe Phe Gly Thr Tyr Ser Phe 
20 25 30 

lie Asn Thr Pro Val Asp Ala Phe Pro Asp lie Ser Pro Thr Gin Val 
35 40 45 

Lys lie lie Leu Lys Leu Pro Gly Ser Ser Pro Glu Glu Met Glu Asn 
50 55 60 

Asn lie Val Arg Pro Leu Glu Leu Glu Leu Leu Gly Leu Lys Gly Gin 
65 70 75 80 

Lys Ser Leu Arg Ser Val Ser Lys Tyr Ser lie Ser Asp lie Thr lie 

85 90 95 

Asp Phe Asp Asp Ser Val Asp lie Tyr Leu Ala Arg Asn lie Val Asn 
100 105 110 

u Arg Leu Ser Ser Val Met Lys Asp Leu Pro Val Gly Val Glu Gly 
115 120 125 

Gly Met Ala Pro lie Val Thr Pro Leu Ser Asp lie Phe Met Phe Thr 
130 135 140 

lie Asp Gly Asn lie Thr Glu lie Glu Lys Arg Gin Leu Leu Asp Phe 
145 150 155 160 

Val lie Arg Pro Gin Leu Arg Met lie Ser Gly Val Ala Asp Val Asn 
165 170 175 

Ser He Gly Gly Phe Ser Arg Ala Phe Val He Val Pro Asp Phe Asn 
180 185 190 

Asp Met Ala Arg Leu Gly Val Ser He Ser Asp Leu Glu Ser Ala Val 
195 200 205 

Arg Val Asn Leu Arg Asn Ser Gly Ala Gly Arg Val Asp Arg Asp Gly 
210 215 220 
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Glu Thr Phe Leu Val Lys He Gin Thr Ala Ser Leu Ser Leu Glu Asp 
225 230 235 240 

He Gly Lys He Thr Val Ser Thr Asn Leu Gly His Leu His He Lys 
245 250 255 

Asp Phe Ala Lys Val He Ser Gin Ser Arg Thr Arg Leu Gly Phe Val 
260 265 270 

Thr Lys Asp Gly Val Gly Glu Thr Thr Glu Gly Leu Val Leu Ser Leu 
275 280 285 

Lys Asp Ala Asn Thr Lys Glu He He Thr Gin Val Tyr Gin Lys Leu 
290 295 300 

Glu Glu Leu Lys Pro Phe Leu Pro Asn Gly Val Ser He Asn Val Phe 
305 310 315 320 

Tyr Asp Arg Ser Glu Phe Thr Gin Lys Ala He Ala Thr Val Ser Lys 
325 330 335 

hr Leu He Glu Ala Val Val Leu He He He Thr Leu Phe Leu Phe 
340 345 350 

Leu Gly Asn Leu Arg Ala Ser Val Ala Val Gly Val He Leu Pro Leu 
355 360 365 

Ser Leu Ser Val Ala Phe He Phe He Lys Phe Ser Asp Leu Thr Leu 
370 375 380 

Asn Leu Met Ser Leu Gly Gly Leu Val He Ala He Gly Met Leu He 
385 390 395 400 

Asp Ser Ala Val Val Val Val Glu Asn Ala Phe Glu Lys Leu Ser Ala 
405 410 415 

Asn Thr Lys Thr Thr Lys Leu His Ala He Tyr Arg Ser Cys Lys Glu 
420 425 430 

He Ala Val Ser Val Val Ser Gly Val Val He lie He Val Phe Phe 
435 440 445 

1 Pro He Leu Thr Leu Gin Gly Leu Glu Gly Lys Met Phe Arg Pro 
4 50 455 460 

Leu Ala Gin Ser He Val Tyr Ala Leu Leu Gly Thr Leu Val Leu Ser 
465 470 475 480 

He Thr He He Pro Val Val Ser Ser Leu Val Leu Lys Ala Thr Pro 
485 490 495 

His Ser Glu Thr Phe Leu Thr Arg Phe Leu Asn Arg He Tyr Ala Pro 
500 505 510 

Leu Leu Glu Phe Phe Val His Asn Pro Lys Lys Val He Leu Gly Ala 
515 520 525 

Phe Val Phe Leu He Ala Ser Leu Ser Leu Phe Pro Phe Val Gly Lys 
530 535 540 

Asn Phe Met Pro Val Leu Asp Glu Gly Asp Val Val Leu Ser Val Glu 
545 550 555 560 
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Thr Thr Pro Ser lie Ser Leu Asp Gin Ser Arg Asp Leu Met Leu Asn 
565 570 575 

lie Glu Ser Ala lie Lys Lys His Val Lys Glu Val Lys Ser He Val 
580 585 590 

Ala Arg Thr Gly Ser Asp Glu Leu Gly Leu Asp Leu Gly Gly Leu Asn 
595 600 605 

Gin Thr Asp Thr Phe He Ser Phe He Pro Lys Lys Glu Trp Ser Val 
610 615 620 

Lys Thr Lys Asp Glu Leu Leu Glu Lys He Met Asp Ser Leu Lys Asp 
625 630 635 640 

Phe Lys Gly He Asn Phe Ser Phe Thr Gin Pro He Glu Met Arg He 
645 650 655 



Ser Glu Met Leu Thr Gly Val Arg Gly Asp Leu Ala Val Lys He Phe 
660 665 670 



y Asp Gly He Ser Glu Leu Asn Glu Leu Ser Phe Gin He Ala Gin 
675 680 685 

Ala Leu Lys Gly He Lys Gly Ser Ser Glu Val Leu Thr Thr Leu Asn 
690 695 700 

Glu Gly Val Asn Tyr Leu Tyr Val Thr Pro Asn Lys Glu Ser Met Ala 
70S 710 715 720 

Asp Val Gly He Thr Ser Asp Glu Phe Ser Lys Phe Leu Lys Ser Ala 
725 730 735 

Leu Glu Gly Leu Val Val Asp Val He Pro Thr Gly He Ser Arg Thr 
740 745 750 

Pro Val Met He Arg Gin Glu Ser Asp Phe Ala Ser Ser He Thr Lys 
755 760 765 

He Lys Ser Leu Ala Leu Thr Ser Lys Tyr Gly Val Leu Val Pro He 
770 775 780 

r Ser He Ala Lys He Glu Glu Val Asp Gly Pro Val Ser Val Val 
5 790 795 800 

Arg Glu Asn Ser Met Arg Met Ser Val Val Arg Ser Asn Val Val Gly 
805 810 815 

Arg Asp Leu Lys Ser Phe Val Glu Glu Ala Lys Lys Val He Ala Gin 
820 825 830 

Asn He Lys Leu Pro Pro Ser Tyr Tyr He Thr Tyr Gly Gly Gin Phe 
835 840 845 

Glu Asn Gin Gin Arg Ala Asn Lys Arg Leu Ser Thr Val He Pro Leu 
850 855 860 

Ser He Leu Ala He Phe Phe He Leu Phe Phe Thr Phe Lys Ser He 
865 870 875 880 

Pro Leu Ala Leu Leu He Leu Leu Asn He Pro Phe Ala Val Thr Gly 
885 890 895 
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Gly Leu lie Ala Leu Phe Ala Val Gly Glu Tyr lie Ser Val Pro Ala 
900 905 910 

Ser Val Gly Phe lie Ala Leu Phe Gly He Ala Val Leu Asn Gly Val 
915 920 925 

Val Met He Gly Tyr Phe Lys Glu Leu Leu Leu Gin Gly Lys Ser Val 
930 935 940 

Glu Glu Cys Val Leu Leu Gly Ala Lys Arg Arg Leu Arg Pro Val Leu 
94 5 950 955 960 

Met Thr Ala Cys He Ala Gly Leu Gly Leu Leu Pro Leu Leu Phe Ser 
965 970 975 

His Ser Val Gly Ser Glu Val Gin Lys Pro Leu Ala He Val Val Leu 
980 985 990 

Gly Gly Leu Val Thr Ser Ser Ala Leu Thr Leu Leu Leu Leu Pro Pro 
995 1000 1005 

st Phe Met Leu He Ala Lys Lys He Lys He Val * 
1010 1015 1020 

(2) ANGABEN ZU SEQ ID NO: 103: 

(i) SEQUENZKENNZEICHEN : 

(A) LANGE: 202 8 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS149 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..2028 




(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 103: 

G TCT AAA GGT TTG AGT ATC GGT AAT AAA ATC ATA TTG TGC GTG GCG 
Leu Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Cys Val Ala 
1025 1030 1035 

TTG ATT GTG ATC GTG TGC GTG AGC ATT TTA GGG GTG TCC TTA AAC AGC 
Leu He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
1040 1045 1050 

AGG GTG AAA GAG ATT TTA AAA GAA AGC GCT CTG CAT TCT ATG CAA GAT 
Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
1055 1060 1065 

AGT TTG CAT TTT AAG GTT AAT GAA GTG CAA GGG GTT TTA GAA AAC ACT 
Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
1070 1075 1080 1085 



TAT ACG AGC ATG GGC ATT GTT AAA GAA ATG CTC CCT AAA GAC ACC AAA 
Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
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1090 1095 1100 

AGA GAA ATC AAA ATC GGC TTG TTA AAA AAC TTC ATT TTA GCC AAT TCG 288 
Arg Glu lie Lys lie Gly Leu Leu Lys Asn Phe lie Leu Ala Asn Ser 
1105 1110 1115 

CAT GTC GCT GGG GTG AGC ATG TTT TTT AAA GGC AGA GAA GAT TTA AGA 336 
His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
1120 1125 1130 

TTA ACG CTT TTA AGG GAT AAC AAT ACG ATT AAG CTA GTG GAA AAT CCG 3 84 

Leu Thr Leu Leu Arg Asp Asn Asn Thr He Lys Leu Val Glu Asn Pro 
1135 1140 1145 

TCA TTA GAG AAT AGC CCT TTA GCG CAA AAA GCG ATG AAA AAT AAA GAA 432 
Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 
1150 1155 1160 1165 

ATT TCT AAA AGT TTG GGT TAT TAT AGG AAA ATG CCT AAT GGG GCG GAA 480 
le Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 
1170 1175 1180 

GTT TAT GGG GTG GAT ATT CTT TTA CCT TTA TTG AAT GAG AAC GCT CAA 528 
Val Tyr Gly Val Asp He Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 
1185 1190 1195 

GAG GTT GTA GGG GCT TTG ATG ATT TTT ATT TCC ATT GAC AGC TTC AGC 576 
Glu Val Val Gly Ala Leu Met He Phe He Ser He Asp Ser Phe Ser 
1200 1205 1210 

AAT GAA ATC ACT AAA AAC AGG AGC GAT TTA TTT TTA ATT GGC ACT AAA 624 
Asn Glu He Thr Lys Asn Arg Ser Asp Leu Phe Leu He Gly Thr Lys 
1215 1220 1225 

GGT AAA GTG CTT TTG AGC GCG AAT AAG AGT TTG CAA GAC AAA CCT ATC 672 
Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro He 
1230 1235 1240 1245 

GCA GAA ATT TAT AAG AGC GTG CCT AAA GCC ACC AAC GAA GTG ATG GCT 720 
Ala Glu He Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
1250 1255 1260 

T TTA GAA AAC GGC TCT AAA GCG ACT TTA GAA TAC TTA GAT CCC TTT 768 
e Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
1265 1270 1275 

AGC CAT AAG GAA AAT TTT TTA GCC GTT GAA ACC TTT AAA ATG CTA GGC 816 
Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
1280 1285 1290 

AAA ACA GAA AGT AAA GAC AAT CTT AAT TGG ATG ATC GCT TTA ATC ATT 864 
Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met He Ala Leu He He 
1295 1300 1305 

GAA AAA GAC AAG GTC TAT GAG CAA GTA GGC TCG GTG CGT TTT GTG GTG 912 
Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
1310 1315 1320 1325 

ATC ATA GCG AGC GCA ATC ATG GTG TTA GCC TTG ATT ATA GCG ATC ACT 960 
He He Ala Ser Ala He Met Val Leu Ala Leu He He Ala He Thr 
1330 1335 1340 
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CTC TTA ATG CGA GCG ATC GTG AGC AGT CGT TTG GAA GCC GTT TCT AGC 1008 
Leu Leu Met Arg Ala lie Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
1345 1350 1355 

ACC TTG TCT CAT TTC TTT AAA TTA TTG AAC AAT CAA GCC AAT TCT AGC 1056 
Thr Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
1360 1365 1370 

GGT ATT AAA TTG ATT GAA GCG AAA TCC AAT GAC GAG TTA GGC CGC ATG 1104 
Gly lie Lys Leu lie Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
1375 1380 1385 

CAA ACA GCG ATC AAT AAA AAT ATC TTG CAA ACC CAA AAA ATC ATG CAA 1152 
Gin Thr Ala lie Asn Lys Asn lie Leu Gin Thr Gin Lys lie Met Gin 
1390 1395 1400 1405 

GAA GAC AGG CAA GCC GTC CAA GAC ACC ATT AAA GTG GTT TCA GAT GTG 12 00 

Glu Asp Arg Gin Ala Val Gin Asp Thr lie Lys Val Val Ser Asp Val 
1410 1415 1420 



GCA GGG AAT TTT GCG GTG CGC ATC ACG GCT GAG CCC GCA AGC CCT 1248 
s Ala Gly Asn Phe Ala Val Arg lie Thr Ala Glu Pro Ala Ser Pro 
1425 1430 1435 

GAT TTG AAA GAA TTG AGG GAC GCG CTA AAT GGG ATC ATG GAT TAT TTG 12 96 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly lie Met Asp Tyr Leu 
1440 1445 1450 

CAA GAA AGC GTA GGG ACT CAC ATG CCA AGC ATT TTC AAA ATC TTT GAA 1344 
Gin Glu Ser Val Gly Thr His Met Pro Ser lie Phe Lys lie Phe Glu 
1455 1460 1465 

AGC TAT TCT GGT TTG GAT TTT AGA GGC CGG ATC CAA AAC GCT TCG GGT 13 92 

Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg lie Gin Asn Ala Ser Gly 
147 0 1475 1480 1485 

AGG GTG GAA CTG GTT ACT AAC GCT TTA GGG CAA GAA ATC CAA AAA ATG 1440 
Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu lie Gin Lys Met 
1490 1495 1500 



CTA GAA ACT TCG TCT AAT TTT GCC AAA GAT TTA GCG AAC GAT AGC GCG 1488 
~eu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
1505 1510 1515 



T TTA AAA GAG TGC GTG CAA AAT TTA GAA AAA GCT TCA AAC TCC CAA 1536 
Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys Ala Ser Asn Ser Gin 
1520 1525 1530 

CAC AAA AGC TTG ATG GAA ACT TCC AAA ACG ATA GAA AAT ATC ACC ACT 1584 
His Lys Ser Leu Met Glu Thr Ser Lys Thr lie Glu Asn lie Thr Thr 
1535 1540 1545 

TCC ATT CAA GGC GTG AGC TCT CAA AGT GAA GCC ATG ATT GAA CAA GGG 163 2 

Ser lie Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 
1550 1555 1560 1565 

CAA GAC ATT AAA AGC ATT GTA GAA ATC ATT AGA GAT ATT GCT GAT CAA 1680 
Gin Asp He Lys Ser He Val Glu He He Arg Asp He Ala Asp Gin 
1570 1575 1580 

ACC AAT CTT TTA GCC TTA AAC GCC GCT ATT GAA GCC GCA AGG GCC GGC 172 8 

Thr Aon Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
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1585 1590 1595 

GAG CAT GGC AGA GGC TTT GCG GTG GTG GCT GAT GAG GTA AGA AAG CTC 1776 
Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
1600 1605 1610 

GCT GAA AGG ACG CAA AAA TCG CTC AGC GAG ATT GAA GCC AAT ATC AAT 1824 
Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
1615 1620 1625 

ATT TTA GTG CAA AGC ATT TCA GAC ACG AGC GAA AGC ATT AAA AAC CAG 1872 
He Leu Val Gin Ser He Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
1630 1635 1640 1645 

GTT AAA GAA GTG GAA GAA ATC AAC GCT TCT ATT GAA GCC TTA AGA TCG 1920 
Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
1650 1655 1660 

GTT ACT GAG GGC AAT CTA AAA ATC GCT AGC GAT TCT TTA GAA ATC AGT 1968 
"al Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
1665 1670 1675 

"CAA GAA ATT GAC AAA GTT TCT AAC GAT ATT TTA GAA GAT GTG AAT AAA 2 016 

Gin Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
1680 1685 1690 

AAG CAG TTT TAA 2028 
Lys Gin Phe * 
1695 



(2) ANGABEN ZU SEQ ID NO: 104: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 676 Aminosauren 

(B) ART : Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 104: 

Leu Ser Lys Gly Leu Ser He Gly Asn Lys He He Leu Cys Val Ala 
1 5 10 15 

u He Val He Val Cys Val Ser He Leu Gly Val Ser Leu Asn Ser 
20 25 30 

Arg Val Lys Glu He Leu Lys Glu Ser Ala Leu His Ser Met Gin Asp 
35 40 45 

Ser Leu His Phe Lys Val Asn Glu Val Gin Gly Val Leu Glu Asn Thr 
50 55 60 

Tyr Thr Ser Met Gly He Val Lys Glu Met Leu Pro Lys Asp Thr Lys 
65 70 75 80 

Arg Glu He Lys He Gly Leu Leu Lys Asn Phe He Leu Ala Asn Ser 

85 90 95 

His Val Ala Gly Val Ser Met Phe Phe Lys Gly Arg Glu Asp Leu Arg 
100 105 110 
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Leu Thr Leu Leu Arg Asp Asn Asn Thr lie Lys Leu Val Glu Asn Pro 

115 120 125 

Ser Leu Glu Asn Ser Pro Leu Ala Gin Lys Ala Met Lys Asn Lys Glu 

130 135 140 

lie Ser Lys Ser Leu Gly Tyr Tyr Arg Lys Met Pro Asn Gly Ala Glu 

145 150 155 160 

Val Tyr Gly Val Asp lie Leu Leu Pro Leu Leu Asn Glu Asn Ala Gin 

165 170 175 

Glu Val Val Gly Ala Leu Met lie Phe lie Ser lie Asp Ser Phe Ser 

180 185 190 

Asn Glu lie Thr Lys Asn Arg Ser Asp Leu Phe Leu lie Gly Thr Lys 

195 200 205 



Gly Lys Val Leu Leu Ser Ala Asn Lys Ser Leu Gin Asp Lys Pro lie 
210 215 220 



a Glu lie Tyr Lys Ser Val Pro Lys Ala Thr Asn Glu Val Met Ala 
225 230 235 240 

lie Leu Glu Asn Gly Ser Lys Ala Thr Leu Glu Tyr Leu Asp Pro Phe 
245 250 255 

Ser His Lys Glu Asn Phe Leu Ala Val Glu Thr Phe Lys Met Leu Gly 
260 265 270 

Lys Thr Glu Ser Lys Asp Asn Leu Asn Trp Met He Ala Leu He He 
275 280 285 

Glu Lys Asp Lys Val Tyr Glu Gin Val Gly Ser Val Arg Phe Val Val 
290 295 300 

He He Ala Ser Ala He Met Val Leu Ala Leu He He Ala He Thr 
305 310 315 320 

Leu Leu Met Arg Ala He Val Ser Ser Arg Leu Glu Ala Val Ser Ser 
325 330 335 

r Leu Ser His Phe Phe Lys Leu Leu Asn Asn Gin Ala Asn Ser Ser 
340 345 350 

Gly He Lys Leu He Glu Ala Lys Ser Asn Asp Glu Leu Gly Arg Met 
355 360 365 

Gin Thr Ala He Asn Lys Asn He Leu Gin Thr Gin Lys He Met Gin 
370 375 380 

Glu Asp Arg Gin Ala Val Gin Asp Thr lie Lys Val Val Ser Asp Val 
385 390 395 400 

Lys Ala Gly Asn Phe Ala Val Arg He Thr Ala Glu Pro Ala Ser Pro 
405 410 415 

Asp Leu Lys Glu Leu Arg Asp Ala Leu Asn Gly He Met Asp Tyr Leu 
420 425 430 

Gin Glu Ser Val Gly Thr His Met Pro Ser He Phe Lys He Phe Glu 
435 440 445 
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Ser Tyr Ser Gly Leu Asp Phe Arg Gly Arg He Gin Asn Ala Ser Gly 
450 455 460 

Arg Val Glu Leu Val Thr Asn Ala Leu Gly Gin Glu He Gin Lys Met 
465 470 475 480 

Leu Glu Thr Ser Ser Asn Phe Ala Lys Asp Leu Ala Asn Asp Ser Ala 
485 490 495 

Asn Leu Lys Glu Cys Val Gin Asn Leu Glu Lys -Ala Ser Asn Ser Gin 
500 505 510 

His Lys Ser Leu Met Glu Thr Ser Lys Thr He Glu Asn He Thr Thr 
515 520 525 

Ser He Gin Gly Val Ser Ser Gin Ser Glu Ala Met He Glu Gin Gly 
530 535 540 

Gin Asp He Lys Ser He Val Glu He He Arg Asp He Ala Asp Gin 
^45 550 555 560 

hr Asn Leu Leu Ala Leu Asn Ala Ala He Glu Ala Ala Arg Ala Gly 
565 570 575 

Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg Lys Leu 
580 585 590 

Ala Glu Arg Thr Gin Lys Ser Leu Ser Glu He Glu Ala Asn He Asn 
595 600 605 

He Leu Val Gin Ser He Ser Asp Thr Ser Glu Ser He Lys Asn Gin 
610 615 620 

Val Lys Glu Val Glu Glu He Asn Ala Ser He Glu Ala Leu Arg Ser 
625 630 635 640 

Val Thr Glu Gly Asn Leu Lys He Ala Ser Asp Ser Leu Glu He Ser 
645 650 655 

Gin Glu He Asp Lys Val Ser Asn Asp He Leu Glu Asp Val Asn Lys 
660 665 670 

s Gin Phe * 
675 

(2) ANGABEN ZU SEQ ID NO: 105: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 273 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT: 
(B) CLON(E) : HPS161 



(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..273 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 105: 

GTG GCG GTG AAA AAA ATC GTT GTG AGT TGG TGT GTG GCG TTG GCT TTT 4 8 

Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
680 685 690 

TTA AGC GCG GAT TCA GCA CAA GCC AAT AAA GCG ATC AGT AAT GCG GAT 96 
Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala lie Ser Asn Ala Asp 
695 700 705 

TTG ATT AAA GAG ATA AGG GAT TTA AAA AAA ATC ATC AGC GCG CAA AAC 144 
Leu lie Lys Glu lie Arg Asp Leu Lys Lys lie lie Ser Ala Gin Asn 
710 715 720 

ACT GAG ATT AAC AAC TTA AGA AAA GTG CAA GAA GTG TTG TCT GGG CAA 192 
Thr Glu lie Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
725 730 735 740 

TTA GGG GAC ATG CGT AAG GAT ATA TTA AGC ACT AGA GAT TAT TGC ATT 240 
*eu Gly Asp Met Arg Lys Asp lie Leu Ser Thr Arg Asp Tyr Cys lie 
745 750 755 

AGC TTA AGG CCT TAT ATC TAT AAT TGG CGC TAG 273 
Ser Leu Arg Pro Tyr lie Tyr Asn Trp Arg * 
760 765 

(2) ANGABEN ZU SEQ ID NO: 106: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 91 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: lp6: 

Val Ala Val Lys Lys lie Val Val Ser Trp Cys Val Ala Leu Ala Phe 
1 5 10 15 

Leu Ser Ala Asp Ser Ala Gin Ala Asn Lys Ala He Ser Asn Ala Asp 
20 25 30 

u He Lys Glu He Arg Asp Leu Lys Lys He He Ser Ala Gin Asn 
35 40 45 

Thr Glu lie Asn Asn Leu Arg Lys Val Gin Glu Val Leu Ser Gly Gin 
50 55 60 

Leu Gly Asp Met Arg Lys Asp He Leu Ser Thr Arg Asp Tyr Cys He 
65 70 75 80 

Ser Leu Arg Pro Tyr He Tyr Asn Trp Arg * 
85 90 

(2) ANGABEN ZU SEQ ID NO: 107: 

( i ) SEQUENZKENNZEICHEN : 

(A) LANGE: 759 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 
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(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS176 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE.-1..759 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 107: 



ATG 
Met 


TTA 
Leu 


GGG 
Gly 


AAA 
Lys 
95 


AAA 
Lys 


AAC 
Asn 


GAA 
Glu 


GAA 
Glu 


GTC 
Val 
100 


TTG 
Leu 


ATT 
He 


GAT 
Asp 


GAA 
Glu 


AAT 
Asn 
105 


TTG 
Leu 


GTT 
Val 


GGG 
Gly 


GGT 
Gly 


GTG 
Val 
110 


ATA 
He 


GCC 
Ala 


CTT 
Leu 


GAT 
Asp 


AGA 
Arg 
115 


TTG 
Leu 


GCA 
Ala 


AAA 
Lys 


CTC 
Leu 


AAT 
Asn 
120 


AAG 
Lys 


GCC 
Ala 


AAT 
Asn 


Kg 


ACT 
Thr 
125 


TTC 
Phe 


AAA 
Lys 


AGG 
Arg 


GCT 
Ala 


TTT 
Phe 
130 


TAT 
Tyr 


CTC 
Leu 


TCT 
Ser 


ATG 
Met 


GCA 
Ala 
135 


CTC 
Leu 


AAT 
Asn 


GTC 
Val 


GCC 
Ala 


GCT 
Ala 
140 


GTA 
Val 


ACG 
Thr 


AGT 
Ser 


ATT 
He 


GTG 
Val 
145 


ATG 
Met 


ATG 
Met 


ATG 
Met 


CCT 
Pro 


TTG 
Leu 
150 


AAG 
Lys 


AAA 
Lys 


ACG 
Thr 


GAT 
Asp 


ATA 
He 
155 


TTT 

Phe 


GTT 
Val 


TAT 
Tyr 


GGC 
Gly 


ATT 
He 
160 


GAT 
Asp 


CGA 
Arg 


TAC 
Tyr 


ACA 
Thr 


GGA 
Gly 
165 


GAA 
Glu 


TTT 
Phe 


AAA 
Lys 


ATT 
He 


GTC 
Val 
170 


AAA 
Lys 


CGC 
Arg 


TCC 
Ser 


GAT 
Asp 


GCT 
Ala 
175 


AGG 
Arg 


CAA 
Gin 


ATC 
He 


GTC 
Val 


AAT 
Asn 
180 


TCT 
Ser 


GAA 
Glu 


GCC 
Ala 


GTT 
Val 


GTG 
Val 
185 


GAT 
Asp 


AGT 
Ser 


GCA 
Ala 


ACT 
Thr 


TCA 
Ser 
190 


AAA 
Lys 


TTT 
Phe 


GTA 
Val 


TCA 
Ser 


TTG 
Leu 
195 


CTG 
Leu 


TTT 
Phe 


GGT 
Gly 


TAT 
Tyr 


AGC 
Ser 
200 


AAA 
Lys 


AAT 
Asn 


TCT 
Ser 


TTG 
^eu 


AGG 
Arg 
205 


GAT 
Asp 


CGC 
Arg 


AAG 
Lys 


GAT 
Asp 


CAA 
Gin 
210 


CTA 
Leu 


ATG 
Met 


CAG 
Gin 


TAT 
Tyr 


TGC 
Cys 
215 


GAT 
Asp 


GTG 
Val 


AGT 
Ser 


TTC 
Phe 


Waa 

Gin 
220 


ACC 
Thr 


CAA 
Gin 


GCA 
Ala 


ATG 
Met 


AGA 
Arg 
225 


ATG 
Met 


TTC 
Phe 


AAT 
Asn 


GAA 
Glu 


AAT 
Asn 
230 


ATC 
He 


AGA 
Arg 


CAA 
Gin 


TTC 
Phe 


GTA 
Val 
235 


GAT 
Asp 


AAA 
Lys 


GTC 
Val 


CGA 
Arg 


GCA 
Ala 
240 


GAA 
Glu 


GCT 
Ala 


ATC 
He 


ATT 
He 


AGC 
Ser 
245 


TCT 
Ser 


AAC 
Asn 


ATA 
He 


CAA 
Gin 


AGA 
Arg 
250 


GAA 
Glu 


AAA 
Lys 


GTC 
Val 


AAA 
Lys 


AAT 
Asn 
255 


AGT 
Ser 


CCC 
Pro 


TTA 
Leu 


ACG 
Thr 


AGA 
Arg 
260 


TTA 
Leu 


ACA 
Thr 


TTT 
Phe 


TTC 
Phe 


ATT 
He 
265 


ACC 
Thr 


ATC 
He 


AAA 
Lys 


ATC 
lie 


ACA 
Thr 
270 


CCT 
Pro 


GAT 
Asp 


ACA 
Thr 


ATG 
Met 


GAA 
Glu 
275 


AAT 
Asn 


TAT 
Tyr 


GAA 
Glu 


TAT 
Tyr 


ATC 
He 
280 


ACT 
Thr 


AAA 
Lys 


AAA 
Lys 


CAA 
Gin 


GTA 
Val 


ACT 
Thr 


ATT 
He 


TAT 
Tyr 


TAT 
Tyr 


GAT 
Asp 


TTT 
Phe 


GCT 
Ala 


AGA 
Arg 


GGT 
Gly 


AAC 
Asn 


TCT 
Ser 


TCT 
Ser 


CAA 
Gin 


GAA 
Glu 



48 



96 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 
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285 290 295 

T CAA ATC 672 
e Gin lie 
315 

A AAG ATC 720 
g Lys lie 
330 



AAT 


CTT 


ATC 


ATC 


AAT 


CCT 


TTT 


GGC 


TTC 


AAA 


GTG 


TTT 


GAC 


Asn 


Leu 


He 


He 


Asn 


Pro 


Phe 


Gly 


Phe 


Lys 


Val 


Phe 


Asp 


300 










305 








310 




ACA 


GAT 


TTA 


CAA 


AAC 


GAA 


CAG 


ACG 


GTA 


AGC 


GAA 


ATT 


TTG 


Thr 


Asp 


Leu 


Gin 


Asn 


Glu 


Gin 


Thr 


Val 


Ser 


Glu 


He 


Leu 










320 










325 








AGA 


GAA 


GTG 


GAA 


TCA 


AAA 


AAT 


AAG 


GCA 


TTA 


AAT 


AAA 


TAA 


Arg 


Glu 


Val 


Glu 


Ser 


Lys 


Asn 


Lys 


Ala 


Leu 


Asn 


Lys 


★ 
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(2) ANGABEN ZU SEQ ID NO: 108: 

( i ) S EQUENZ KENNZ E I CHEN : 

(A) LANGE: 253 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

<ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 108: 

Met Leu Gly Lys Lys Asn Glu Glu Val Leu He Asp Glu Asn Leu Val 
1 5 10 15 

Gly Gly Val He Ala Leu Asp Arg Leu Ala Lys Leu Asn Lys Ala Asn 
20 25 30 

Arg Thr Phe Lys Arg Ala Phe Tyr Leu Ser Met Ala Leu Asn Val Ala 
35 40 45 

Ala Val Thr Ser He Val Met Met Met Pro Leu Lys Lys Thr Asp He 
50 55 60 

Phe Val Tyr Gly He Asp Arg Tyr Thr Gly Glu Phe Lys He Val Lys 
65 70 75 80 

Arg Ser Asp Ala Arg Gin He Val Asn Ser Glu Ala Val Val Asp Ser 
85 90 95 

Thr Ser Lys Phe Val Ser Leu Leu Phe Gly Tyr Ser Lys Asn Ser 
100 105 HO 

Leu Arg Asp Arg Lys Asp Gin Leu Met Gin Tyr Cys Asp Val Ser Phe 
115 120 125 

Gin Thr Gin Ala Met Arg Met Phe Asn Glu Asn He Arg Gin Phe Val 
"0 135 140 

Asp Lys Val Arg Ala Glu Ala He He Ser Ser Asn He Gin Arg Glu 
145 150 155 160 

Lys Val Lys Asn Ser Pro Leu Thr Arg Leu Thr Phe Phe He Thr He 
165 170 175 

Lys He Thr Pro Asp Thr Met Glu Asn Tyr Glu Tyr He Thr Lys Lys 
180 185 190 

Gin Val Thr He Tyr Tyr Aap Phe Ala Arg Gly Asn Ser Ser Gin Glu 




759 
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195 200 205 

Asn Leu He He Asn Pro Phe Gly Phe Lys Val Phe Asp He Gin He 
210 215 220 

Thr Asp Leu Gin Asn Glu Gin Thr Val Ser Glu He Leu Arg Lys He 
225 230 235 240 

Arg Glu Val Glu Ser Lys Asn Lys Ala Leu Asn Lys * 
245 250 

(2) ANGABEN ZU SEQ ID NO: 109: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 1245 Basenpaare 

(B) ART: Nucleotid 

(C) STRANGFORM: beides 

(D) TOPOLOGIE: linear 



(vii) UNMITTELBARE HERKUNFT : 
(B) CLON(E) : HPS187 

(ix) MERKMAL: 

(A) NAME/ SCHLUSSEL : CDS 

(B) LAGE:1..1245 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO : 109: 



ATG 
Met 


GAG 
Glu 
255 


AAA 
Lys 


GGA 
Gly 


GTT 
Val 


TGG 
Trp 


AAT 
Asn 
260 


ATG 
Met 


CTT 
Leu 


GAC 
Asp 


ATA 
lie 


TGG 
Trp 
265 


ATA 
He 


GAT 
Asp 


ATG 
Met 


ATA 
He 


ATT 
He 
270 


TGT 
Cys 


ATT 
He 


TTT 
Phe 


TAT 
Tyr 


TTG 
Leu 
275 


CTC 
Leu 


TTT 
Phe 


TTT 
Phe 


ACG 
Thr 


ACT 
Thr 
280 


CCT 
Pro 


TAC 
Tyr 


ATT 
He 


GTA 
Val 


GGC 
Gly 
285 


GAT 
Asp 


ATT 
He 


TTG 
Leu 


CAA 
Gin 


TTG 
Leu 
290 


AAA 
Lys 


TTT 
Phe 


ATC 
He 


CGC 
Arg 


CAA 
Gin 
295 


AAG 
Lys 


CTC 
Leu 


TGC 
Cys 


GAA 
Glu 


AAA 
Lys 
300 


CCT 
Pro 


T 
1 


TTA 
Leu 


CTC 
Leu 


CCA 
Pro 
305 


CAA 
Gin 


AAG 
Lys 


GAT 
Asp 


TAT 
Tyr 


GAA 
Glu 
310 


GAA 
Glu 


GCG 
Ala 


GGA AAT 
Gly Asn 


TAT GCC 
Tyr Ala 
315 


ATT 
He 


AGG 
Arg 


AAA 
Lys 


ATG 
Met 
320 


CAA 
Gin 


TTA 
Leu 


TCC 
Ser 


ATT 
He 


ATT 
He 
325 


TCT 
Ser 


CAA 
Gin 


ATT 
He 


TTA 
Leu 


GAC 
Asp 
330 


GGG 
Gly 


ATA 
He 


ATC 
He 


TTT 
Phe 


GCT 
Ala 
335 


GGG 
Gly 


TGG 
Trp 


GTC 
Val 


TTT 
Phe 


TTT 
Phe 
340 


GGT 
Gly 


TTG 
Leu 


ACG 
Thr 


CAT 
His 


TTA 
Leu 
345 


GAA 
Glu 


GAT 
Asp 


CTC 
Leu 


ACG 
Thr 


CAT 
His 
350 


TAT 
Tyr 


TTA 
Leu 


AAC 
Asn 


CTT 
Leu 


CCT 
Pro 
355 


GAA 
Glu 


ACG 
Thr 


CTA 
Leu 


GGT 
Gly 


TAC 
Tyr 
360 


TTG 
Leu 


GTG 
Val 


TTT 
Phe 


GCC 
Ala 


TTG 
Leu 
365 


TTG 
Leu 


TTT 
Phe 


TTA 
Leu 


GCG 
Ala 


ATT 
He 
370 


CAA 
Gin 


AGC 
Ser 


GTT 
Val 


TTA 
Leu 


GCT 
Ala 
375 


TTA 
Leu 


CCC 
Pro 


ATT 
He 


AGC 
Ser 


TAC 
Tyr 
380 


TAC 
Tyr 



48 



96 



144 



192 



240 



288 



336 



384 
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ACC ACG ATG CAT TTG GAT AAG GAA TTT GGC TTT TCT AAG GTG AGC TTG 
Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
385 390 395 

TCG TTG TTT TTT AAG GAT TTT TTC AAA GGG TTA TCG CTC ACT TTA AGC 
Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
400 405 410 

GTG GGG TTG TTG TTG ATT TAC ACT CTC ATT ATG ATC ATT GAA CAT GTG 
Val Gly Leu Leu Leu lie Tyr Thr Leu lie Met lie lie Glu His Val 
415 420 425 

GAA CAT TGG GAG ATT AGC TCG TTT TTT GTC GTG TTT GTT TTT ATG ATC 
Glu His Trp Glu He Ser Ser Phe Phe Val Val Phe Val Phe Met He 
430 435 440 445 

TTG GCT AAT CTT TTT TAC CCT AAA ATC GCT CAG CTT TTC AAC CAA TTC 
Leu Ala Asn Leu Phe Tyr Pro Lys He Ala Gin Leu Phe Asn Gin Phe 
450 455 460 



C CCC TTG AAC AAT AGG GAT TTA GAG AGT CAA ATT GAG GGC ATG ATG 
r Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin He Glu Gly Met Met 
465 470 475 

GAT AAG GTG GGT TTT AAA TCT GAA GGT ATC TTT GTG ATG GAC GCT AGC 
Asp Lys Val Gly Phe Lys Ser Glu Gly He Phe Val Met Asp Ala Ser 
480 485 490 

AAG AGG GAC GGG CGT TTG AAC GCG TAT TTT GGA GGC TTG GGT AAA AAC 
Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
495 500 505 

AAG CGG GTG GTG TTG TTT GAC ACT TTG ATC TCT AAA GTT GGG ACA GAA 
Lys Arg Val Val Leu Phe Asp Thr Leu He Ser Lys Val Gly Thr Glu 
510 515 520 525 

GGG CTT TTA GCC ATT TTA GGG CAT GAA TTA GGG CAT TTT AAA AAT AAG 
Gly Leu Leu Ala He Leu Gly His Glu Leu Gly His Phe Lys Asn Lys 
530 535 540 



• 



GAT TTG TTG AAA AGT TTA GGG ATT ATG GGA GGC TTA CTC GCT CTT GTT 
sp Leu Leu Lys Ser Leu Gly He Met Gly Gly Leu Leu Ala Leu Val 
545 550 555 



T GCT CTG ATC GCT CAT TTG CCG CCG TTG GTT TTT GAA GGC TTC AAT 
Phe Ala Leu lie Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
560 565 570 

GTC TCA CAA ACG CCA GCG AGT TTG ATT GCG ATT TTA CTC TTG TTT TTG 
Val Ser Gin Thr Pro Ala Ser Leu He Ala He Leu Leu Leu Phe Leu 
575 580 585 

CCG GTA TTT TCT TTT TAC GCT ATG CCT TTG ATC GGG TTT TTT AGC CGA 
Pro Val Phe Ser Phe Tyr Ala Met Pro Leu He Gly Phe Phe Ser Arg 
590 595 600 605 

AAG AAT GAA TAC AAT GCA GAC AAG TTT GGG GCG AGT TTA AGC TCT AAA 
Lys Aen Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
610 615 620 

GAG GTT TTA GCC AAA GCG TTA GTG TCT ATT GTG AGT GAG AAT AAA GCG 
Glu Val Leu Ala Lys Ala Leu Val Ser He Val Ser Glu Asn Lys Ala 
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625 630 635 

TTC CCC TAT TCG CAC CCT TTT TAT GTT TTC TTG CAT TTC ACG CAC CCG 12 00 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
640 645 650 

CCC TTA TTA GAG CGC TTG AAA GCT TTG GAT TAT GAA ATT GAA TGA 1245 
Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu lie Glu * 
655 660 665 

(2) ANGABEN ZU SEQ ID NO: 110: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 415 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 110: 

et Glu Lys Gly Val Trp Asn Met Leu Asp lie Trp lie Asp Met lie 
1 5 10 15 

lie Cys lie Phe Tyr Leu Leu Phe Phe Thr Thr Pro Tyr lie Val Gly 
20 25 30 

Asp lie Leu Gin Leu Lys Phe lie Arg Gin Lys Leu Cys Glu Lys Pro 
35 40 45 

Val Leu Leu Pro Gin Lys Asp Tyr Glu Glu Ala Gly Asn Tyr Ala lie 
50 55 60 

Arg Lys Met Gin Leu Ser He He Ser Gin He Leu Asp Gly He He 
65 70 75 80 

Phe Ala Gly Trp Val Phe Phe Gly Leu Thr His Leu Glu Asp Leu Thr 
85 90 95 

His Tyr Leu Asn Leu Pro Glu Thr Leu Gly Tyr Leu Val Phe Ala Leu 
100 105 110 

u Phe Leu Ala He Gin Ser Val Leu Ala Leu Pro He Ser Tyr Tyr 
115 120 125 

Thr Thr Met His Leu Asp Lys Glu Phe Gly Phe Ser Lys Val Ser Leu 
130 135 140 

Ser Leu Phe Phe Lys Asp Phe Phe Lys Gly Leu Ser Leu Thr Leu Ser 
14 5 150 155 160 

Val Gly Leu Leu Leu He Tyr Thr Leu He Met He He Glu His Val 
165 170 175 

Glu His Trp Glu He Ser Ser Phe Phe Val Val Phe Val Phe Met He 
180 185 190 

Leu Ala Asn Leu Phe Tyr Pro Lys He Ala Gin Leu Phe Asn Gin Phe 
195 200 205 

Thr Pro Leu Asn Asn Arg Asp Leu Glu Ser Gin He Glu Gly Met Met 
210 215 220 
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Asp Lys Val Gly Phe Lys Ser Glu Gly lie Phe Val Met Asp Ala Ser 
225 230 235 240 

Lys Arg Asp Gly Arg Leu Asn Ala Tyr Phe Gly Gly Leu Gly Lys Asn 
245 250 255 

Lys Arg Val Val Leu Phe Asp Thr Leu lie Ser Lys Val Gly Thr Glu 
260 265 270 

Gly Leu Leu Ala He Leu Gly His Glu Leu Gly His Phe Lys Asn Lvs 
275 280 285 

Asp Leu Leu Lys Ser Leu Gly He Met Gly Gly Leu Leu Ala Leu Val 
290 295 300 

Phe Ala Leu He Ala His Leu Pro Pro Leu Val Phe Glu Gly Phe Asn 
305 310 315 320 

Val Ser Gin Thr Pro Ala Ser Leu He Ala He Leu Leu Leu Phe Leu 
325 330 335 

•o Val Phe Ser Phe Tyr Ala Met Pro Leu lie Gly Phe Phe Ser Arg 
340 345 350 

Lys Asn Glu Tyr Asn Ala Asp Lys Phe Gly Ala Ser Leu Ser Ser Lys 
355 360 365 

Glu Val Leu Ala Lys Ala Leu Val Ser He Val Ser Glu Asn Lys Ala 
370 375 380 

Phe Pro Tyr Ser His Pro Phe Tyr Val Phe Leu His Phe Thr His Pro 
385 390 395 400 

Pro Leu Leu Glu Arg Leu Lys Ala Leu Asp Tyr Glu He Glu * 
405 410 415 

(2) ANGABEN ZU SEQ ID NO: 111: 

( i ) S EQUENZ KENNZE I CHEN : 

(A) LANGE: 1566 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNMI TTELBARE HERKUNFT: 
(B) CLON{E) : HPS189 

(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1 . . 1566 



(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 111: 

ATG AAA AAC ATT TAT CTT GAT GTG AAA GCC AGC ATT GAA AAT CTC CAA 4 8 

Met Lys Asn He Tyr Leu Asp Val Lys Ala Ser He Glu Asn Leu Gin 
420 425 430 

AAT ATT TTT AAA AAC ACT GAT AAT GAA AAT GAA AGA CTA AAA AAA TTC 96 
Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
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435 440 445 

AAC CAA GAA GCG TTG GAG GTG TTT CAA AAA TTA GAG CGT GAA AGT TTA 144 
Asn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
450 455 460 

AAA GAG CTT GAA AGC TTA AAA AAT AAT GAG GAG TGG GAA AAT TTT ACT 192 
Lys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
465 470 475 

ATC GCT TTT TAT GGG GAA ACC GGT GCG GGG AAA TCA ACC TTC ATT GAA 240 
lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
480 485 490 495 

TGT TTG AGA ATG TTT TTT AAA GAA CAA AGT AAA GTA GTT CAA CAA GAA 288 
Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 
500 505 510 



CGA TTC AAG CGG CTT TAT TCC AAT TAC CAA AAC AAC TAT CAA AAT GAT 336 
g Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
515 520 525 



rAA TGC AAA AAG CAA GCT ATT TTA AAC GAA CTT CAT TCA TTG CAA GAT 3 84 

Glu Cys Lys Lys Gin Ala lie Leu Asn Glu Leu His Ser Leu Gin Asp 
530 535 540 

GGA GCG ATC ATA GGC GAT GGG AGG AGC GAT TTC ACT TTA AAA ACA CGA 432 
Gly Ala lie lie Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
545 550 555 



TCT TAT TCT TTC CAA TAC AAC CAT CAA AAC TTT ACT TTG CTT GAT GTT 
Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
560 565 570 575 
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CCA GGG ATA GAA GGC GAC GAA AAA AAA GTG ATC GAT CAG ATT TCT AAC 528 
Pro Gly lie Glu Gly Asp Glu Lys Lys Val lie Asp Gin He Ser Asn 
580 585 590 

GCA ACG CAA AAA GCC CAT GCT ATT TTT TAT GTT ACC AAA ACG CCT AAT 576 
Ala Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
595 600 605 



T CCG CAA AAA GGA GAA GAG AAA AAA GAA GGG ACG ATT GAA AAA ATC 624 
Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr lie Glu Lys He 
610 615 620 



CAA AAA CAA CTT GAT TCG CAA ACA GAG GTA TGG ACG ATT TTT AAC AAA 672 
Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
625 630 635 

CCG ATT AAC AAC CCA AGA GCT TTC AAA GAT GGG CTT ATT GAT GGA AGC 720 
Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
640 645 650 655 

GAA AAA GAA AGC TTA AAA ATT TTA AAT AAA GAA ATG AAA AAC ATT TTA 768 
Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
660 665 670 

GGC AAA CAC TAC AAG GGC TAT AAA GCA GTG AGC GCC CAA GTG GCT TTT 816 
Gly Lys His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
675 680 685 
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TAT GGT CTT TCA TCG GCT TTG ATC CCA GGG ACT GAT TTT GAT AAA AAC 864 
Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
690 695 700 

AAA CAA AAA TTT TTA AAA GAT TTT AAA GCA AGA GAA TTA TTG TAT CAA 912 
Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
705 710 715 

TCC CAT TTC CAA CAA TTA GGA GAA TTT ATA GCC GAA GAG CTT ATT AAA 960- 
Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
720 725 730 735 

AAC TCG CGT GCC AAA ATC ATT CAA TCA AAC TGC AAT AAA GCC TTA AAA 1008 
Asn Ser Arg Ala Lys lie lie Gin Ser Asn Cys Asn Lys Ala Leu Lys 
740 745 750 



GTG GTA GAA CAA TTG CAA AAG GCG ATC GAA ATT ACG ATT GAA AAA CGG 1056 
Val Val Glu Gin Leu Gin Lys Ala lie Glu lie Thr lie Glu Lys Arg 
755 760 765 



C GAT CCA ATG ATT AAA GAA GCA CAA GAA TAC CAA CAC GAA GCC CGC 1104 
e Asp Pro Met lie Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
770 775 780 



TAT AAT CTG GAT CGT TCT ACA GAT AAA TTT ATA TTA AAT TTA ACC AAT 1152 
Tyr Asn Leu Asp Arg Ser Thr Asp Lys Phe lie Leu Asn Leu Thr Asn 
785 790 795 

TCA GCG TTC TAC GAA ATC GAT CAA TTC AAA TCT GAC TTG AGA GAA AAA 1200 
Ser Ala Phe Tyr Glu lie Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
800 805 810 815 

ATG TAT GCG CAT ATT AAC AAA AAT ATT GAA GAT GAG GAA TGT AAA GAA 124 8 

Met Tyr Ala His lie Asn Lys Asn lie Glu Asp Glu Glu Cys Lys Glu 
820 825 830 

pj^rj, QQp^ TTQ QAA 1296 

lie Phe Lys Asn Glu Leu lie Gin Gly lie Glu Thr Leu His Glu Asp 
835 840 845 

ATA AAA TGG CGG TTT AGA GAA TGT GAG AAA CGA TTT GAT GGA GAG ATA 1344 
lie Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu lie 
850 855 860 



GAA GCT ATT AAA CAA CTT GAA TAC AGA ATT AAA GAT TCT CTA GCA 13 92 

ys Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
865 870 875 

ATG TTA GAG CGC ATC AGT ATT GAT AGA GAC TTT AAT CTT AAT TTT GAT 144 0 

Met Leu Glu Arg He Ser He Asp Arg Asp Phe Asn Leu Asn Phe Asp 
880 885 890 895 

ACT GAT AGC GGT ATT GAT GGA ACA AAA TTA GCC ACT TCA ATA GGA GGT 14 88 

Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
900 905 910 

TTG GGT TTG CTT GGG ATA TTT AAC GCT TGG AAT CCT ATG GGT TGG CTT 153 6 

Leu Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
915 920 925 

GCT CTG ACC GCA GGA TTA TTG CAG GAT TAG 1566 
Ala Leu Thr Ala Gly Leu Leu Gin Asp * 



930 



935 




(2) ANGABEN ZU SEQ ID NO: 112: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 522 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 112: 

Met Lys Asn lie Tyr Leu Asp Val Lys Ala Ser lie Glu Asn Leu Gin 
1 5 10 15 

Asn lie Phe Lys Asn Thr Asp Asn Glu Asn Glu Arg Leu Lys Lys Phe 
20 25 30 

,sn Gin Glu Ala Leu Glu Val Phe Gin Lys Leu Glu Arg Glu Ser Leu 
k 35 40 45 

iys Glu Leu Glu Ser Leu Lys Asn Asn Glu Glu Trp Glu Asn Phe Thr 
50 55 60 

lie Ala Phe Tyr Gly Glu Thr Gly Ala Gly Lys Ser Thr Phe lie Glu 
g 5 70 75 80 

Cys Leu Arg Met Phe Phe Lys Glu Gin Ser Lys Val Val Gin Gin Glu 

85 90 95 

Arg Phe Lys Arg Leu Tyr Ser Asn Tyr Gin Asn Asn Tyr Gin Asn Asp 
100 105 110 

Glu Cys Lys Lys Gin Ala lie Leu Asn Glu Leu His Ser Leu Gin Asp 
115 120 125 

Gly Ala lie lie Gly Asp Gly Arg Ser Asp Phe Thr Leu Lys Thr Arg 
130 135 140 

Ser Tyr Ser Phe Gin Tyr Asn His Gin Asn Phe Thr Leu Leu Asp Val 
145 150 155 160 

i Gly lie Glu Gly Asp Glu Lys Lys Val lie Asp Gin He Ser Asn 
165 170 175 

Ala Thr Gin Lys Ala His Ala He Phe Tyr Val Thr Lys Thr Pro Asn 
180 185 190 

Pro Pro Gin Lys Gly Glu Glu Lys Lys Glu Gly Thr He Glu Lys He 
195 200 205 

Gin Lys Gin Leu Asp Ser Gin Thr Glu Val Trp Thr He Phe Asn Lys 
210 215 220 

Pro He Asn Asn Pro Arg Ala Phe Lys Asp Gly Leu He Asp Gly Ser 
225 230 235 240 

Glu Lys Glu Ser Leu Lys He Leu Asn Lys Glu Met Lys Asn He Leu 
245 250 255 

Gly Lya His Tyr Lys Gly Tyr Lys Ala Val Ser Ala Gin Val Ala Phe 
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260 265 270 

Tyr Gly Leu Ser Ser Ala Leu lie Pro Gly Thr Asp Phe Asp Lys Asn 
275 280 285 

Lys Gin Lys Phe Leu Lys Asp Phe Lys Ala Arg Glu Leu Leu Tyr Gin 
290 295 300 

Ser His Phe Gin Gin Leu Gly Glu Phe lie Ala Glu Glu Leu lie Lys 
305 310 315 320 

Asn Ser Arg Ala Lys lie lie Gin Ser Asn Cys Asn Lys Ala Leu Lys 
325 330 335 

Val Val Glu Gin Leu Gin Lys Ala lie Glu lie Thr He Glu Lys Arg 
340 345 350 



He Asp Pro Met He Lys Glu Ala Gin Glu Tyr Gin His Glu Ala Arg 
355 360 365 



r Asn Leu Asp Arg Ser Thr Asp Lys Phe He Leu Asn Leu Thr Asn 
370 375 380 



Ser Ala Phe Tyr Glu He Asp Gin Phe Lys Ser Asp Leu Arg Glu Lys 
385 390 395 400 

Met Tyr Ala His He Asn Lys Asn He Glu Asp Glu Glu Cys Lys Glu 
405 410 415 

He Phe Lys Asn Glu Leu He Gin Gly He Glu Thr Leu His Glu Asp 
420 425 430 

He Lys Trp Arg Phe Arg Glu Cys Glu Lys Arg Phe Asp Gly Glu He 
435 440 445 

Lys Glu Ala He Lys Gin Leu Glu Tyr Arg He Lys Asp Ser Leu Ala 
450 455 460 

Met Leu Glu Arg He Ser He Asp Arg Asp Phe Asn Leu Asn Phe Asp 
465 470 475 480 

Thr Asp Ser Gly He Asp Gly Thr Lys Leu Ala Thr Ser He Gly Gly 
485 490 495 

u Gly Leu Leu Gly He Phe Asn Ala Trp Asn Pro Met Gly Trp Leu 
500 505 510 

Ala Leu Thr Ala Gly Leu Leu Gin Asp * 
515 520 

(2) ANGABEN ZU SEQ ID NO: 113: 

/ A \ 
V J- / 

(A) LANGE: 1782 Basenpaare 

(B) ART: Nucleotid 

(C) STRANG FORM : beides 

(D) TOPOLOGIE: linear 



(vii) UNM I TTE LB ARE HERKUNFT : 
(B) CLON(E) : HPS191 
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(ix) MERKMAL: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE:1..1782 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 113: 

ATG AAA GCT ATA AAA ATA CTT TTT ATA ATG ACA CTC AGT TTA AAC GCT 4 8 

Met Lys Ala lie Lys lie Leu Phe lie Met Thr Leu Ser Leu Asn Ala 
525 530 535 

ATC AGC GTG AAT AGG GCG TTG TTT GAT TTA AAA GAT TCG CAA TTA AAA 96 
lie Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
540 545 550 

GGG GAA TTA ACG CCA AAA ATA GTG AAT TTT GGG GGT TAT AAA AGC AGC 144 
Gly Glu Leu Thr Pro Lys lie Val Asn Phe Gly Gly Tyr Lys Ser Ser 
555 560 565 570 



£T GAA GAG TGG GGG GCT ACG GCT TTA AAC TAT ATC AAT GCG GCT AAT 192 
r Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr lie Asn Ala Ala Asn 
575 580 585 




GGC GAT GCG AAA AAA TTC AGC ACT CTA GTG GAA AAA ATG CGT TTT AAC 24 0 

Gly Asp Ala Lys Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
590 595 600 

TCC GGT ATA TTG GGG AAT TTA AGA GTG CAT GCA CGT TTG AGG CAA GCC 288 
Ser Gly lie Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
605 610 615 

CTA AAA TTG CAA AAG AAT TTG AAA TAT TGC CTT AAA ATC ATC GCT AGG 336 
Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys lie lie Ala Arg 
620 625 630 

GAT TCT TTT TAT AGC TAC CGC ACC GGT ATT TAT ATC CCC TTA GGC ATT 384 
Asp Ser Phe Tyr Ser Tyr Arg Thr Gly lie Tyr lie Pro Leu Gly lie 
^35 640 645 650 

TCT TTA AAA GAT CAA AAA ACG GCT CAA AAA ATG CTC GCT GAT TTG AGC 432 
Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
655 660 665 

G GTA GGG GCG TAT CTT AAA AAA CAA CAA GAG AAT GAA AAG GCT CAA 480 
1 Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
670 675 680 

AGC CCT TAT TAC AGA AAC AAC AAC TAT TAC AAC TCT TAC TAT AGC CCT 52 8 

Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
685 690 695 

TAT TAC GGA ATG TAT GGT ATG TAT GGC ATG GGC ATG TAT GGA ATG TAT 576 
Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
700 70S 710 

GGC ATG GGC ATG TAT GAT TTT TAT GAC TTT TAT GAT GGC ATG TAT GGA 62 4 

Gly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
? 15 720 725 730 

TTC TAC CCT AAC ATG TTT TTC ATG ATG CAA GTT CAA GAT TAC TTG ATG 672 
Phe Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
735 740 745 
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TTA GAA AAT TAC ATG TAT GCG CTC GAT CAA GAA GAG ATT TTA GAT CAT 72 0 

Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu lie Leu Asp His 
750 755 760 

GAC GCT TCT ACT GAC CAA CTT GAT ACG CCT ACT GAT GAT GAC AAA GAC 768 
Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
765 770 775 

GAT AAA GAC GAT AAA TCC TTA CAG CAG GCA AAT CTT ATG AAC TTT TAT 816 
Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
780 785 790 

CGT GAT CCC AAA TTC AGC AAA GGC ATT CAA ACC AAC CGC TTG AAT AGC 864 
Arg Asp Pro Lys Phe Ser Lys Gly lie Gin Thr Asn Arg Leu Asn Ser 
795 800 805 810 

GCT TTA GTC AAT TTA GAC AAC AGT CGC ATG CTC AAA GAC AAT TCG CTT 912 
Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
815 820 825 



C CAC ACT AAA GCC ATG CCC ACT AAA AGC GTG GAT GCG ATA ACT TCT 960 
e His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala lie Thr Ser 
830 835 840 



CAA GCC AAA GAG CTT AAC CAT TTA GTG GGG CAA ATC AAA GAA ATG AAG 1008 
Gin Ala Lys Glu Leu Asn His Leu Val Gly Gin lie Lys Glu Met Lys 
845 850 855 

CAA GAC GGG GCG AGT CCT AGT AAG ATT GAT TCA GTT GTC AAT AAA GCT 1056 
Gin Asp Gly Ala Ser Pro Ser Lys lie Asp Ser Val Val Asn Lys Ala 
860 865 870 

ATG GAA GTG AGG GAC AAG CTA GAC AAT AAT CTC AAC CAA CTA GAC AAT 1104 
Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 
875 880 885 890 

GAC TTA AAA GAT CAA AAA GGG CTT TCA AGC GAG CAA CAA GCT CAA GTG 1152 
Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 
895 900 905 

GAT AAA GCC CTA GAC AGC GTG CAA CAA TTA AGC CAT AGC AGC GAT GTG 1200 
Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
910 915 920 

G GGG AAT TAT TTA GAC GGG AGT TTG AAA ATT GAT GGC GAT GAT AGA 124 8 

Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys lie Asp Gly Asp Asp Arg 
925 930 935 

GAT GAT TTG AAT GAT GCG ATG AAT AAC CCT ATG CAA CAA CCC GTG CAA 12 96 

Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
940 945 950 

CAA ACG CCT ACT AGC AAC ATG GCC GAC ACC CAT GCA AAT GAC AGC AAG 1344 
Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
955 960 965 970 

GAT CAA GGG AGT AAC GCG CTC ATA AAC CCT AAC AGC GCC ACT AAC GCC 13 92 

Asp Gin Gly Ser Asn Ala Leu lie Asn Pro Asn Ser Ala Thr Asn Ala 
975 980 985 

GAC GAC ACT CAC ACT GAC GAT ACT CAC ACT GAC ACT AAC ACC ACA AAC 144 0 

Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
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990 995 1000 

GAT GCT AGC ACC ACT GAC ACC CCC ACT GAC GAT AAA GAT GCT AGC GGC 
Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
1005 1010 1015 

TTG AAC AAT ACC GGC GAT ATG AAT AAC ACG GAT ACC GGC AAC ACG GAC 
Leu Asn Asn Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
1020 1025 1030 

ACC GGC AAT ACG GAT ACC GGT AAC ACT GAT GAT ATG AGC AAC ATG AAC 
Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
1035 1040 1045 1050 



1055 1060 1065 



1070 1075 1080 



1085 1090 1095 



AAC 


GGC . 


Asn 


Gly . 


AAC 


GAC . 


Asn 


Asp : 


*TG 


GGT . 


Met 


Gly . 


GAT 


ATG ■ 


Asp 


Met 1 




1100 


AAT 


TGA 


Asn 




1115 



1105 1110 



(2) ANGABEN ZU SEQ ID NO: 114: 

(i) SEQUENZKENNZEICHEN: 

(A) LANGE: 594 Aminosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 



^^^^ 



(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 114: 



let Lys Ala lie Lys lie Leu Phe lie Met Thr Leu Ser Leu Asn Ala 
15 10 15 

lie Ser Val Asn Arg Ala Leu Phe Asp Leu Lys Asp Ser Gin Leu Lys 
20 25 30 

Gly Glu Leu Thr Pro Lys lie Val Asn Phe Gly Gly Tyr Lys Ser Ser 
35 40 45 

Thr Glu Glu Trp Gly Ala Thr Ala Leu Asn Tyr lie Asn Ala Ala Asn 
50 55 60 

Gly Asp Ala LyB Lys Phe Ser Thr Leu Val Glu Lys Met Arg Phe Asn 
65 70 75 80 



Ser Gly lie Leu Gly Asn Leu Arg Val His Ala Arg Leu Arg Gin Ala 
85 90 95 
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Leu Lys Leu Gin Lys Asn Leu Lys Tyr Cys Leu Lys lie lie Ala Arg 
100 105 110 

Asp Ser Phe Tyr Ser Tyr Arg Thr Gly lie Tyr lie Pro Leu Gly He 
115 120 125 

Ser Leu Lys Asp Gin Lys Thr Ala Gin Lys Met Leu Ala Asp Leu Ser 
130 135 140 

Val Val Gly Ala Tyr Leu Lys Lys Gin Gin Glu Asn Glu Lys Ala Gin 
145 150 155 160 

Ser Pro Tyr Tyr Arg Asn Asn Asn Tyr Tyr Asn Ser Tyr Tyr Ser Pro 
165 170 175 

Tyr Tyr Gly Met Tyr Gly Met Tyr Gly Met Gly Met Tyr Gly Met Tyr 
180 185 190 



ly Met Gly Met Tyr Asp Phe Tyr Asp Phe Tyr Asp Gly Met Tyr Gly 
195 200 205 



e Tyr Pro Asn Met Phe Phe Met Met Gin Val Gin Asp Tyr Leu Met 
210 215 220 

Leu Glu Asn Tyr Met Tyr Ala Leu Asp Gin Glu Glu He Leu Asp His 
225 230 235 240 

Asp Ala Ser Thr Asp Gin Leu Asp Thr Pro Thr Asp Asp Asp Lys Asp 
245 250 255 

Asp Lys Asp Asp Lys Ser Leu Gin Gin Ala Asn Leu Met Asn Phe Tyr 
260 265 270 

Arg Asp Pro Lys Phe Ser Lys Gly He Gin Thr Asn Arg Leu Asn Ser 
275 280 285 

Ala Leu Val Asn Leu Asp Asn Ser Arg Met Leu Lys Asp Asn Ser Leu 
290 295 300 

Phe His Thr Lys Ala Met Pro Thr Lys Ser Val Asp Ala He Thr Ser 
305 310 315 320 



Ala Lys Glu Leu Asn His Leu Val Gly Gin He Lys Glu Met Lys 
325 330 335 



Gin Asp Gly Ala Ser Pro Ser Lys He Asp Ser Val Val Asn Lys Ala 
340 345 350 

Met Glu Val Arg Asp Lys Leu Asp Asn Asn Leu Asn Gin Leu Asp Asn 

355 360 365 

Asp Leu Lys Asp Gin Lys Gly Leu Ser Ser Glu Gin Gin Ala Gin Val 

370 375 380 

Asp Lys Ala Leu Asp Ser Val Gin Gin Leu Ser His Ser Ser Asp Val 
385 390 395 400 

Val Gly Asn Tyr Leu Asp Gly Ser Leu Lys He Asp Gly Asp Asp Arg 
405 410 415 

Asp Asp Leu Asn Asp Ala Met Asn Asn Pro Met Gin Gin Pro Val Gin 
420 425 430 
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Gin Thr Pro Thr Ser Asn Met Ala Asp Thr His Ala Asn Asp Ser Lys 
435 440 445 

Asp Gin Gly Ser Asn Ala Leu lie Asn Pro Asn Ser Ala Thr Asn Ala 
450 455 460 

Asp Asp Thr His Thr Asp Asp Thr His Thr Asp Thr Asn Thr Thr Asn 
465 470 475 480 

Asp Ala Ser Thr Thr Asp Thr Pro Thr Asp Asp Lys Asp Ala Ser Gly 
485 490 495 

Leu Asn Asn Thr Gly Asp Met Asn Asn Thr Asp Thr Gly Asn Thr Asp 
500 505 510 

Thr Gly Asn Thr Asp Thr Gly Asn Thr Asp Asp Met Ser Asn Met Asn 
515 520 525 



Asn Gly Asn Asp Asp Thr Gly Asn Ala Asn Asp Asp Met Ser Asn Gly 
530 535 540 



sn Asp Met Gly Asp Asp Leu Asn Asn Ala Asn Asp Met Asn Asp Asp 
45 550 555 560 

Met Gly Asn Gly Asn Asp Asp Met Gly Asp Met Gly Asp Met Asn Asp 
565 570 575 

Asp Met Gly Gly Asp Met Gly Asp Met Gly Asp Met Gly Asp Met Gly 
580 585 590 

Asn * 



